单元 测试 最 初 兴起 于 敏捷 社区 。1997 年 ， 设 计 模 式 四 巨头 之 一 Erich Gamma 和 极限 编程 发 明 人 Kent Beck 共 同 开 发 了 
JUnit， 而 JUnit 框 架 在 此 之 后 又 引领 了 xUnit 家 族 的 发 展 ， 深 刻 地 影响 了 单元 测试 在 各 种 编程 语言 中 的 普及 。 


随 着 敏捷 开发 大 潮 的 流行 ， 单 元 测试 也 成 了 现代 软件 开 友 中 必 不 可 少 的 工具 之 一 。 古 人 云 ， 流 水 不 腐 ， 尸 枢 不 蝇 。 越 来 越 多 
的 程序 员 推 崇 目 动 化 测试 的 理念 ， 作 为 经 济 合理 的 回归 测试 手段 ， 以 适应 迭代 开 友 的 需要 。 然 而 有 些 时 候 ， 这 些 测试 对 生产 力 并 
无 明显 改善 ， 人 们 盲目 地 退 求 测试 履 兰 率 ， 却 忽视 了 测试 代码 的 质量 ， 各 种 无 效 单元 测试 反而 市 来 了 沉重 的 维护 负担 。 


2013 年 年 钥 ， 一 位 远 在 新 加 圾 的 印度 朋友 Ram 残 推荐 我 看 过 本 书 的 英文 版 ， 当 时 完整 凌 了 一 和 遍 ， 狗 得 该 书 深入 浅 出 ， 履 兰 
了 很 多 关于 编写 优秀 单元 测试 的 内 容 ， 而 且 忆 结 得 很 有 条 理 。 没 想到 的 是 ，2013 年 下 半年 ， 出 版 社 的 编辑 找到 我 品 有 一 本 书 愿 
不 愿 翻译 ， 没 想到 正 是 本 书 ! 既然 有 缘 ， 当 时 就 答应 了 下 来 。 


本 以 为 半年 可 以 完成 翻译 ， 却 没 想到 过 去 的 12 个 月 里 生活 和 工作 出 现 各 种 变化 与 惊喜 ， 于 是 翻译 工作 一 拖 再 抱 ， 进 展 不 
快 。 

2014 年 6 月 Scrum Gathering 大 会 在 上 海 召 开 ， 作 为 话题 演讲 的 总 制作 人 和 大 会 讲师 ， 原 想 书 能 尽快 出 版 ， 融 可 以 市 去 一 些 
回馈 社区 ， 只 可 异 没 能 实现 ， 又 让 朋友 们 多 等 了 几 个 月 。 

目前 ,我 从 事 敏捷 教练 和 培训 的 工作 ， 同 时 通过 动手 实践 仍 在 不 断 提高 目 己 的 编程 水 平 。 希 望 借 此 机 会 ， 将 我 过 去 几 年 的 敏 


捷 实 践 经 验 分 享 给 更 多 人 。 


个 人 喜欢 和 敏捷 社区 的 软件 匠 友 动手 切磋 ， 一 起 编写 高 质量 代码 ， 另 外 在 讲授 CSD (认证 3crum 开 友 者 或 称 敏捷 技术 实践 ) 
课程 时 ， 也 经 常会 接触 来 自 不 同行 业 的 软件 开 友 者 。 在 这 个 过 程 中 ， 我 们 友 现 ， 审 美 之 前 有 必要 先 学 审 壬 。 好 的 编码 模式 各 有 和 干 
秋 ， 能 抓 到 老鼠 的 丈 是 好 猫 。 然 而 ， 坏 的 模式 却 是 有 限 的 。 


本 书 作者 Lasse 在 敏捷 技术 实践 领域 一 直 走 在 前 沿 ， 在 TDD 和 单元 测试 领域 里 有 研究。 他 将 本 书 分 为 三 部 分 ， 首 先 分析 了 编 
写 测 试 的 目的 ， 以 及 优秀 测试 的 特征 ， 然 后 是 本 书 的 核心 部 分 ， 从 三 个 角度 一 一 阐述 了 测试 的 坏 味道 。 此 外 ， 本 书 还 介绍 了 测试 
蔡 身 的 概念 与 用 法 ， 如 何 用 另类 J 久 VM 语言 为 Java 代 码 编写 测试 ， 如 何 提高 代码 的 可 测 性 ， 以 及 如 何 加 速 测试 和 构建 的 速度 ， 从 
而 加 快 反馈 的 速度 。 


翻译 是 个 耗 时 的 关 事 ， 时 间 投 入 与 经 济 回 报 不 成 比例 。 于 是 ， 有 人 不 茶 问 你 为 什么 还 要 坚持 翻译 。 在 我 看 来 ， 既 然 目 己 从 社 
区 中 获得 很 多 养分 ， 也 残 有 义务 将 更 多 丰厚 的 知识 和 实践 经 验 分 享 给 大 家 。 同 样 的 原因 ， 几 年 来 我 也 一 直 坚 持 参 与 组 织 各 种 社区 
活动 ， 回 馈 社区 。 


作为 译 者 ， 因 为 能 力 水 平 有 限 ， 难 免 会 有 下 漏 ， 在 此 晨 请 读者 见谅 ， 并 给 予 批评 指正 。 
在 本 书 的 翻译 过 程 中 得 到 了 多 位 软件 匠 友 大 力 协助 ， 非 常 感谢 : 妖 哲 、 伍 醋 、 王 洪亮 (排名 不 分 先后 ) 。 


感谢 所 有 关心 和 鼓励 我 的 人 。 特 别 是 我 的 家 人 ， 在 那些 挑灯 奋战 的 夜晚 里 默默 地 给 予 着 支持 。 


> 
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残 思 追 写 方 ”月 已 西 入 


序言 


2009 年 6 月 10 日 夜里 ， 我 收 到 来 自 Manning 出 版 社 Christina Rudloff 的 电子 邮件 ， 问 我 是 否认 识 合适 的 人 选 ， 希 望 可 以 按 


照 Roy Osherove 的 《.NET 音 元 测试 亏 术 》 来 写 一 本 Java 髓 的 书 。 我 跟 她 襄 ， 我 来 。 


那 是 很 久 以 前 的 事情 了 ， 而 你 现在 看 到 的 书 与 Roy 的 书 已 经 大 不 相同 了 。 我 来 解释 一 下 
直接 地 从 .NET 翻 译 成 Java， 仅 仅 会 为 了 符合 技术 平台 、 工 具 和 读者 的 变化 而 重 写 一 些 必要 之 处 。 我 完成 了 


项 目 一 开始 只 是 
第 1~3 章 ， 然 后 突然 友 现 目 己 不 只 重 写 了 一 些 段 沙 ， 而 是 整个 章节 。 那 书 不 是 我 的 调调 ;有 时 我 不 同意 Roy 的 看 法 或 者 意见 有 侦 


差 ， 有 时 我 希望 表达 目 己 的 想法 ， 和 直截了当 ， 大 步 前 进 。 


最 终 ， 我 决定 从 头 开始 。 
本 帮助 Java 开 发 者 改善 测试 的 书 ， 让 人 深入 了 解 何 为 优秀 的 测试 ， 以 





很 显然 这 不 是 一 个 翻译 项 目 。 这 是 全 新 的 题目 

及 避免 沙 入 各 种 陷阱 。 你 仍然 会 在 本 书 中 以 各 种 方式 见 到 Roy 的 思想 。 例 如 ， 第 二 部 分 的 章 证 标题 束 明 显 地 从 Roy 那 里 借鉴 而 
来 ， 而 第 7 草 在 很 大 程度 上 要 感谢 Roy 的 《.NET 单 元 测试 艺术 》 书 中 的 相应 部 分 。 

本 书 是 针对 Java 程 序 员 的 。 但 我 并 不 想 将 想法 束缚 在 本 书 中 ， 因 此 即便 模式 目录 中 的 所 有 代码 例子 都 是 用 Java 写 的 , 我 也 尽 


量 避 免 特定 于 语言 的 内 容 。 书 写 优秀 测试 是 个 与 语言 无 关 的 问题 ， 即 使 你 的 大 部 分 工作 时 间 都 花 在 另 一 种 编程 语言 上 ， 但 是 我 也 


真心 地 推荐 你 市 着 思考 来 阅读 本 书 。 
与 此 同时 ， 我 不 希望 写成 我 喜欢 的 mock 对 象 库 或 JUnit 的 一 个 教程 。 除 了 因为 这 些 技术 更 新 得 太 快 以 全 于 出 版 几 个 月 融会 过 
一 本 目 己 乐意 去 阅读 的 书 。 我 喜欢 专注 的 书籍 ， 它 不 会 强加 我 早 丈 了 解 的 一 个 测试 框架 或 者 用 不 到 的 mock 对 


时 ,我 也 是 希望 写 
象 库 ， 而 造成 额外 负担 。 基 于 这 些 原 因 ， 我 尽量 减少 特定 于 技术 的 建议 。 虽 然 还 是 会 有 一 些 ， 但 是 我 希望 你 知道 我 已 经 尽 最 大 努 
只 是 用 来 有 意义 地 谈论 底层 概念 ， 那 些 概 念 我 认为 是 书写 、 运 行 、 维 护 和 改善 测试 的 基础 。 


人 、\ 


力 来 减少 它们 了 
我 试 着 写 了 上 自己 愿意 读 的 一 本 书 。 我 希望 你 也 喜欢 ， 而 且 最 重要 的 是 能 将 其 中 一 些 想法 融入 到 你 的 实践 中 。 





过 去 10 余 年 间 ，Java 开 友 者 显著 地 青睐 开 友 者 测试 。 如 今 ， 计 算 机 科学 专业 的 毕业 生 无 人 不 知 目 动 化 单元 测试 及 其 在 软件 
法 很 简单 一 一 确保 我 们 的 代码 能 工作 并 且 一 直 能 工作 一 一 但 是 该 技能 需要 花 很 大 力气 去 学 习 。 


个 想 
这 些 都 不 难 。 要 真正 地 掌握 编写 自动 化 单元 测试 实践 ， 需 要 花 大 量 时 间 在 阅读 并 改善 测 
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开 友 中 的 重要 性 。 这 
编写 测试 、 学 习 JUnit 的 测试 框架 ， 
试 代码 上 。 这 种 持续 的 测试 重 构 能 够 尝试 用 不 同 万 式 来 表达 意图 、 组 织 测试 的 不 同行 为 、 用 测试 构建 各 种 用 到 的 对 象 一 一 这 才 


是 一 种 务实 的 万 式 ， 用 来 自我 学 习 和 培养 对 单元 测试 的 感 完 。 
这 种 感 党 是 天 于 哪些 是 优秀 的 单元 测试 ， 而 哪些 不 那么 优秀 。 有 些 是 绝对 的 真理 (比如 完全 在 重复 代码 内 容 的 注释 束 是 见 余 


的 ， 应 该 被 删除 ) ， 但 大 多 数 天 于 单元 测试 的 类 识 都 取决 于 上 下 文 。 通 弟 意 义 上 的 优秀 在 特定 条 件 下 可 能 却 很 糟糕 。 同 样 ， 一 般 


认为 粳 料 和 应 当 避 免 的 想法 有 时 却 是 正确 的 做 法 。 


原来 ， 找 到 优秀 方案 的 最 好 方式 束 是 尝试 一 个 看 似 可 行 的 方法 ， 识 别 该 方法 的 问题 ， 然 后 改变 该 方法 从 而 消除 讨厌 的 部 分 。 
通过 重复 这 个 过 程 ， 不 断 地 评估 和 进化 ， 最 终 你 会 找到 一 个 可 行 的 方案 ， 它 闻 起 来 没 那 么 自 。 你 甚至 会 说 那 是 相当 优秀 的 方式 ! 
考虑 到 这 种 复杂 性 ， 本 书 采 用 了 一 种 风格 和 结构 ， 那 就 是 我 们 不 会 告诉 你 怎么 做 ,也 不 会 告诉 你 蝶 么 编写 单元 测试 。 相 反 ， 


我 打算 给 你 一 个 坚实 的 基础 ， 让 你 知道 哪些 是 我 们 希望 测试 表现 出 的 属性 ， 然 后 给 你 尽 可 能 多 的 例子 来 培养 你 对 测试 坏 味道 的 感 
帮 你 注意 到 测试 中 的 不 合 时 宜 之 处 。 





允 


SA 


上 


本 书 针对 想 要 提高 单元 测试 编写 质量 的 各 个 层次 的 Java 程 序 员 。 虽 然 我们 提供 了 附录 来 教 给 你 测试 框架 (JUnit) ， 但 我 们 
的 主要 目标 是 帮助 已 经 了 解 单 元 测试 的 Java 程 序 员 ， 用 其 喜欢 的 测试 框架 来 编写 更 好 的 单元 测试 。 不 管 你 已 经 写 了 多 少 单元 测 
试 ， 我 们 衣 定 你 仍然 可 以 做 得 更 好 ， 阅 读本 书 或 许 能 市 你 揭示 一 些 难以 言喻 的 想法 。 


路 线 图 
本 书 提 到 了 多 个 方面 的 挑战 ， 因 此 需要 民 好 的 结构 来 支撑 这 些 方面 。 深 思 熟 虑 后 ( 源 自 于 多 次 迭代 中 的 失败 演 试 ) ， 我 们 决 
定 将 本 书 分 为 三 个 部 分 。 


天 于 更 好 的 测试 ， 第 一 部 分 先 介 绍 了 我 们 要 达到 的 目标 ， 以 及 它们 为 什么 是 可 取 的 。 其 中 的 三 草 展 示 了 编写 优秀 测试 的 基本 
工具 和 和 们 蛙 指 南 。 


第 1 章 从 目 动 化 单元 测试 的 价值 主张 开始 。 我 们 通过 考虑 程序 员 生 产 力 的 多 种 因素 来 建立 价值 ， 以 及 编写 优秀 目 动 化 单元 测 
试 如 何 有 助 于 生产 力 ， 或 避免 耽误 我 们 。 


第 2 章 提 高 了 标准 ， 滨 试 定义 什么 是 优秀 的 测试 。 该 章 中 的 属性 和 注意 事项 是 第 二 部 分 的 核心 基础 ， 涉 及 测试 的 可 读 性 、 可 
维护 性 和 可 靠 性 。 


第 3 章 进 一 步 介 绍 测试 替身 ， 作 为 编写 优秀 测试 的 重要 工具 。 我 们 并 不 是 为 了 使 用 测试 替身 而 使 用 ， 而 是 深思 熟 虑 地 用 好 它 
们 。 (它们 不 是 你 想 要 的 银 弹 。) 


第 二 部 分 与 第 一 部 分 形成 鲜明 对 比 ， 把 一 个 测试 坏 味道 的 目录 摆 在 你 面前 。 除 了 摘 述 测试 代码 中 的 可 疑 异 式 外 ， 我 们 也 给 出 
了 面 对 这 些 坏 味 道 时 的 尝试 方案 。 这 些 章 证 分 为 三 个 主题 : 令 可 读 性 退化 的 坏 味 道 、 上 暗示 着 潜在 维护 性 梦 辜 的 坏 味 道 ， 以 及 市 来 
信任 危机 的 坏 味 道 。 第 二 部 分 的 许多 坏 味道 可 以 归 为 三 大 草书 中 的 任何 一 个 ， 但 我 们 尝试 根据 其 主要 影响 来 归 类 。 


第 4 章 中 的 坏 味 道 ， 主 要 侧重 于 过 分 不 透明 的 测试 意图 或 实现 。 我 们 涉及 诸如 模糊 的 断言 、 不 恰当 的 抽象 层次 和 测试 代码 的 


第 ?5 章 中 的 坏 味道 会 导致 企 办公 室 加 班 ， 因 为 要 针对 一 个 小 的 变更 而 没完 没 了 地 修改 某 个 单元 测试 ， 或 者 为 了 一 个 小 的 变更 
要 修改 数 百 个 测试 。 我 们 谈 及 了 代码 重复 、 测 试 代码 中 的 逻辑 和 阐述 触及 文件 系统 的 恐怖 。 我 们 也 不 会 让 缓慢 的 测试 从 眼皮 底下 
溜 过 去 ， 因 为 时 间 融 是 金钱 。 


第 6 章 是 测试 坏 味道 目录 的 最 后 一 部 分 ， 谈 及 一 系列 天 于 假设 的 陷阱 。 有 些 假设 是 由 于 测试 代码 中 麻烦 的 注释 ， 有 些 则 是 由 
于 未 能 清楚 地 表达 上 自己 而 市 来 的 失败 和 不 垃 。 


第 三 部 分 可 以 称 为 “高 级 话题 。 然 而 并 非 如 此 ， 因 为 这 里 的 话题 与 第 一 部 分 和 第 二 部 分 并 无 天 联 。 相 反 ， 这 些 是 Java 程 序 
员 在 编写 测试 时 随时 可 能 碰 到 的 话题 。 毕 竟 ， 无 论 是 天 于 单元 测试 类 的 继承 天 系 ， 还 是 用 来 编写 测试 的 编程 语言 ， 或 是 构建 设施 


运行 测试 的 万 式 ， 几 乎 所 有 关于 “优秀 ”单元 测试 的 内 容 都 依赖 于 上 下 文 ， 所 以 对 于 造成 某 些 程序 员 紧 担 的 话题 ， 却 无 法 打动 另 


外 一 些 人 ， 这 坚 不 奇 怪 。 


第 7 章 烷 接 第 2 草 ， 探 讨 什 么 是 可 测 的 设计 。 先 大 致 曾 述 了 有 用 的 原则 ， 并 湾 清 我 们 其 实 是 在 寻找 模块 化 设计 ， 然 后 我 们 学 
习 了 基本 的 可 测 性 问题 ， 它 会 导致 代码 不 可 测 。 该 草 最 后 给 出 一 些 入 日 的 指南 ， 来 保证 我 们 走 在 可 测 设计 的 康 庄 大 道上 。 


第 8 章 抛 出 一 个 突如其来 的 问题 ， 如 果 我 们 用 Java 之 外 的 编程 语言 来 编写 单元 测试 如 何 ”Java 虚 拟 机 人 允许 当今 的 程序 员 采 用 


一 些 另 类 的 编程 语言 ， 并 将 它们 与 普通 Java 代 码 集成 到 一 起 。 


第 9 章 回 到 现实 的 挑战 ， 应 对 逐渐 缓慢 的 构建 及 延迟 的 测试 结果 。 我 们 从 两 方面 同时 寻找 万 案 ， 一 方面 是 测试 代码 ， 考 虑 如 
何 令 作为 构建 一 部 分 的 代码 加 速 ， 另 一 方面 是 基础 设施 ， 考 虑 如 何 从 更 快 的 硬件 或 不 同 的 硬件 分 配方 式 中 获得 额外 的 吸引 力 。 


尽管 UUnit 的 声望 和 地 位 已 经 是 Java 社 区 中 事实 上 的 单元 测试 框架 ,但 并 非 所 有 的 Java 程 序 员 都 熟悉 这 个 伟大 的 开源 库 。 我 
们 附加 了 两 个 附录 ， 来 帮助 那些 还 没有 体会 害 JUnit 高 级 特性 的 强大 之 处 的 人 。 


附录 A 提供 用 JUnit 编 写 测试 的 入 门 介绍 ， 以 及 当 你 告诉 JUnit 运 行 测试 时 ，JUnit 如 何 来 操作 它们 。 浏 览 完 这 个 附录 后 ， 你 会 
更 懂得 编写 测试 ， 以 及 如 何 用 JUnit 的 API| 来 进行 断言 。 


附录 B 引 人 在 扩 展 JUnit 的 内 置 功 能 ， 于 是 深入 地 探讨 其 API。 我 们 不 会 试图 细致 地 洱 兰 JUnit 的 所 有 方面 ， 而 是 市 你 浏览 两 个 扩 
展 负 Unit 的 常见 方式 一 一 规则 和 运行 器 一 一 这 个 附录 会 展示 一 些 内 置 规则 ， 它 们 不 仅 有 用 ， 而 且 让 你 知道 如 何 与 上 自 定义 插件 打 交 
道 。 
代码 规 沁 

本 书 中 的 代码 示例 包含 Java 源 代码 和 大 量 标记 语言 以 及 输出 代码 清单 。 以 代码 清单 的 方式 来 展示 较 长 的 代码 。 较 短 的 代码 残 
内 联 在 文字 中 。 我 们 经 常会 在 文字 中 提 到 代码 清单 。 许 多 较 长 的 代码 清单 具有 市 编号 的 注解 ， 它 们 会 在 文字 中 提 及 。 


下 载 代 码 


Manning 的 网 站 www.manning.com/EffectiveUnitTesting 上 提供 了 本 书 的 源 代 码 打包 下 载 。 其 中 包含 了 本 书 的 部 分 源 代 
码 ， 供 你 进一步 钻研 。 


下 载 包 中 包括 Apache Maven 2 的 POM 文 件 ， 以 及 Maven (http://maven.apache.org) 的 安装 使 用 说 明 ， 用 来 编译 和 运 
行 示例 。 注 意 ， 下 载 包 不 包含 各 种 依赖 ， 而 首次 运行 Maven 时 你 需要 连接 互联 网 一 一 Maven 会 从 互联 网 下 载 所 需 依 赖 。 随 后 ， 
你 焉 可 以 断 开 网 络 ， 离 线 地 运行 示例 了 。 


代码 示例 用 Java 6 编写 ， 你 需要 安装 它 以 编译 和 运行 示例 。 你 可 以 从 www.oracle.com 下 载 合适 的 Java 环 境 。 (为 了 编译 代 
码 ， 你 需要 下 载 JjDK， 而 不 是 JRE。) 


我 们 还 推荐 安装 合适 的 IDE。 你 可 以 下 载 安 装 最 新 版 的 Eclipse (www.eclipse.org) 或 其 他 主流 工具 比如 Intelliy 
IDEA (www.jetbrains.com) 或 NetBeans (www.netbeans.org) 。 只 要 你 融 悉 ， 这 些 工 具 都 可 以 使 用 。 


何去何从 


这 本 书 应 当 给 你 足够 的 洞察 力 ， 从 而 明显 地 提高 你 的 单元 测试 能 力 。 这 是 一 条 漫漫 长 路 ， 肯 定 会 有 我 们 想不到 或 回答 不 了 的 
问题 。 幸 运 的 是 ， 你 会 遇 到 很 多 同行 ， 许 多 人 会 乐于 分 享 和 在 线 寺 论 测试 代码 的 细微 舌 别 。 


Manning 建 立 了 在 线 论 坛 ， 你 可 以 和 Manning 图 书 的 作者 们 交谈 。 本 书 作者 融 企 Author Online 论 坛 上 ， 网 址 为 


www.manning.com/EffectiveUnitTesting, 


在 testdrivendevelopment 和 extremeprogramming Yahoo! Groups 中 ， 也 有 测试 感染 程序 员 的 活跃 社区 。 这 些 论 坛 是 
优秀 的 讨论 区 ， 不 仅仅 讨论 单元 测试 。 与 此 同时 ， 或 许 你 也 能 收获 测试 代码 之 外 的 一 些 新 想法 。 


如 果 你 寻找 关于 开发 者 测试 的 更 加 集中 的 论坛 ， 那 就 去 看 看 CodeRanch (http://www.coderanch.com) 及 其 优秀 的 
Testing 论 坛 。 那 儿 有 一 群 可 爱 的 牛人 。 


最 重要 的 是 ,我 建议 你 积极 地 与 工作 伙伴 讨论 测试 代码 。 我 目 己 的 某 些 最 佳 见 解 束 是 通过 让 别人 看 我 的 代码 才 得 出 的 。 


致谢 


当 我 签约 写 这 本 书 时 ， 我 以 为 是 个 小 工程 。 一 切 都 那么 简单 ， 没 什么 不 确定 的 。 我 太 天 真 了 。 随 着 几 周 变 成 几 个 月 ， 然 后 变 
成 几 年 ,我 的 一 厢 情 愿 也 变 得 荡然 无 仔 。 如 果 没 有 大 家 的 帮助 ， 这 本 书 不 可 能 问世 ， 私 怕 它 现在 还 在 进行 中 呢 。 


项 目 最 初始 于 与 Manning 出 版 社 的 Christina Rudloff 的 邮件 交谈 ， 从 那 时 起 ， 我 获得 了 大 量 帮 助 ， 非 单 感谢 ， 也 非 音 需 
要 。 


我 要 感谢 Manning 团 队 给 予 的 支持 和 不 懈 努 力 (排名 不 分 先后 ) ，Michael Stephens、Elle Suzuki、Steven Hong.、 
Nick Chase、Karen Tegtmeyer、Sebastian Stirling、Candace M.Gillhoolley、 Maureen Spencer、Ozren Harlovic、 


Frank Pohlmann、Benjamin Berg、Elizabeth Martin、Dottie Marsico、Janet Vall 和 Mary Piergies。 


特别 感谢 各 位 领域 专家 和 评审 者 为 了 改进 本 书 而 做 出 的 努力 ， 他 们 为 本 书市 来 了 专业 经 验 和 知识 。 我 要 向 他 们 致 以 最 真 的 的 
感谢 (排名 不 分 先后 ) ，Jeremy Anderson、Christopher Bartling、Jedidja Bourgeois、Kevin Con-away、Roger 
CornejJo、 Frank Crow、 Chad Davis、Gordon Dickens、Martyn Fletcher、Paul Holser、Andy Kirsch、Antti Koivisto、 
Paul Kronquist、Teppo Kurki、Franco Lombardo、Saicharan Manga、Dave Nicolette、Gabor Paller、 
J.B.Rainsberger、Joonas Reynders、Adam Taft、Federico Tomassetti、Jacob Tomaw、Bas Vodde、Deepak Vohra、 


Rick Wagner、Doug Warren、James Warren、Robert Wenner、Michael Williams 和 Scott Sauyet。 
特别 感谢 Phil Hanna 在 印刷 之 前 对 手稿 进行 的 技术 审 校 。 


最 后 ， 但 也 是 同样 重要 的 ,我 要 感谢 家 人 的 长 期 支持 。 有 时 我 完 得 这 本 书 的 编写 过 程 永 无 休止 。 在 那些 裔 击 着 键盘 的 夜晚 
里 ,谢谢 你 们 的 理解 ， 伴 我 走 过 艰 难 时 期 。 


第 一 部 分 “基础 


本 书 第 一 部 分 打算 利用 各 个 章节 ， 建 立 读者 和 作者 之 间 也 就 是 你 我 之 间 共 同 的 上 下 文 。 本 书 最 终 的 目的 是 帮助 你 提高 编写 优 


秀 测试 的 能 力 ， 第 1 章 先 从 整体 来 看 测试 先行 所 带 来 的 价值 。 然 后 讨论 程序 员 生 产 力 的 动力 学 ， 以 及 各 种 对 测试 和 测试 质量 的 影 
响 ， 最 后 会 简单 地 介绍 两 种 与 自动 化 测试 紧密 相关 的 方法 : 测试 驱动 开 上 友 (Test-Driven Development，TDD) 和 行为 驱动 开 
上 (Behavior-Driven Development, BDD) 。 


第 2 章 挑 起 重担 ， 定 义 了 如 何 才 能 写 出 优秀 的 测试 。 简 而 言 之 ， 我 们 和 希望 写 出 可 读 、 可 维护 、 可 靠 的 测试 。 第 2 部 分 将 会 深入 
兔子 洞 ， 反 转 问 题 ， 检 视 一 系列 我 们 不 希望 看 到 的 反例 。 





第 一 部 分 的 末尾 是 第 3 章 ， 它 会 谈 及 现代 程序 员 最 基本 的 工具 之 一 一 一 测试 替身 (test double) 。 我 们 将 建立 合理 的 用 法 ， 比 
如 隔离 代码 以 使 其 能 够 被 恰当 地 测试 ， 并 且 区 分 各 种 可 能 用 到 的 测试 替身 的 类 型 。 最 后 ， 我 们 指导 如 何 用 好 测试 替身 ， 帮 助 你 绕 


开 常 见 的 坑 ， 同 时 又 能 享受 蔡 身 的 好 处 。 


读 完 前 三 章 ， 你 应 当 明 和 白 哪 种 测试 是 你 希望 编写 的 ， 以 及 为 什么 是 那样 的 。 你 应 当 清 楚 地 理解 测试 蔡 身 ， 将 其 作为 常用 工 
具 。 本 书 其 余部 分 将 根据 这 些 基 础 展开 ， 扶 上 马 ， 送 你 一 程 。 


第 1 章 ”优秀 测试 的 承 诡 


本 章 内 容 包括 : 
: 编写 单元 测试 的 价值 
测试 如 何 提 高 程序 员 的 生产 力 
将 测试 用 作 设 计 工 具 


当 我 开始 吃 上 编程 这 砚 饭 上 时， 世界 看 起 来 与 今日 大 不 一 样 。 那 是 10 多 年 以 前 ， 人 们 使 用 着 简单 的 Vim 和 Emacs 等 文本 编辑 
器 ， 而 非 如 今 的 Eclipse、Net Beans 和 1DEA 等 集成 开发 环境 。 我 清楚 地 记得 ， 某 位 资深 同事 在 调试 软件 时 摆弄 着 Emacs 安 ， 生 
成 大 量 的 System.out.println 调 用 。 我 甚至 还 清楚 地 记得 ， 当 一 个 主要 客户 报告 说 他 们 的 订单 没有 正常 生成 时 ， 我 们 要 把 打印 出 
的 日 志 破 译 出 来 。 


那 时候 ，“ 测 试 ” 对 大 多 数 程 序 员 来 说 意味 着 下 面 两 件 事 之 一 一 一 要 么 是 由 专人 在 自己 完成 编码 之 后 所 做 的 事情 ， 要 么 是 
在 声称 编码 完成 之 前 对 代码 所 捣 敦 的 事情 。 当 引入 一 个 Bug 后 ， 你 会 再 次 对 自己 的 代码 动手 折腾 一 番 一 一 这 次 要 增加 一 些 日 志 ， 
看 看 能 舍 找 出 错误 之 处 。 





目 动 化 惫 是 我 们 最 先进 的 概念 。 我 们 用 makefiles 来 重复 地 编译 和 打包 代码 ， 但 尚未 将 运行 目 动 化 测试 作为 构建 的 一 部 分 。 
我 们 曾 用 各 种 shell 脚 本 来 局 动 一 两 个 “测试 类 ” 操作 生产 代码 的 小 程序 ， 用 来 打印 友 生 了 什么 ， 以 及 对 于 某 些 输入 ， 代 码 
的 输出 是 什么 。 我 们 完全 没有 任何 标准 的 测试 框架 ， 也 没有 目 验 证 (self-verifying) 的 测试 可 以 用 来 报告 断言 中 的 各 种 失败 。 





我 们 走 过 了 漫长 的 日 子 ， 好 不 容易 才 到 今天 。 


1.1 ”国情 咨文 (|: 编写 更 好 的 测试 


下 述 概念 如 今 已 家 广泛 推荐 ， 即 开发 者 应 该 编写 目 动 化 测试 ， 以 便当 上 友 现 回归 问题 时 融 使 构建 失败 。 而 且 ， 测 试 移行 的 编程 


风格 已 有 大 量 的 专业 研究 ， 使 用 自动 化 测试 不 仅 是 保护 回归 ， 而 且 是 帮助 设计 ， 在 编写 代码 之 前 就 指出 代码 的 期 望 行为 ， 从 而 在 
验证 实现 之 前 先 验 证 设计 。 
作为 顾问 ， 我 见 过 很 多 团队 、 组 织 、 产 品 和 代码 。 看 看 今天 的 我 们 ， 很 明显 目 动 化 测试 已 经 成 为 主流 。 这 很 棒 ， 因 为 没有 目 
动 化 测试 ， 大 多 数 软件 项 目 会 比 现在 更 糟 。 目 动 化 测试 改善 了 你 的 生产 力 ， 使 你 获得 并 保持 开 有 速度 。 
救命 ! 我 是 单元 测试 新 手 
如 果 你 还 不 熟悉 如 何 编 写 目 动 化 测试 ， 现 如 今 是 一 个 熟悉 这 种 实践 的 好 时 节 。Manning 出 版 社 出 了 几 本 关于 JUnit 的 书 ， 那 是 


编写 Java 单 元 测试 的 事实 标准 库 ， 还 有 《JUnit in Action》 (第 2 版 ， 作 者 Petar Tahchiev 等 ，2010 年 7 月 出 版 ) ， 是 测试 各 种 Java 代 码 
的 优秀 入 门 教程 ， 涵 盖 从 简单 Java 对 象 到 企业 级 JavaBeans。 


假如 你 在 家 自己 编写 单元 测试 ， 但 却 不 熟悉 Java 或 JUnit， 或 许 你 该 先 看 看 本 书 的 附录 A， 这 样 在 阅读 例子 时 就 不 会 有 麻烦 


自动 化 测试 成 为 主流 ， 并 不 意味 着 我 们 的 测试 覆盖 率 已 达到 理想 状态 ,或 者 生产 力 无 法 再 改善 了 。 事 实 上 ,我 在 过 去 五 年 中 
的 大 量 工作 正 是 帮助 人 们 编写 测试 ， 在 编码 之 前 写 测试 ， 特 别 是 编写 更 好 的 测试 。 

为 什么 编写 更 好 的 测试 这 么 重要 ? 如 果 我 们 不 注意 测试 的 质量 ， 那 又 怎样 ? 我 们 现在 谈 谈 测试 市 给 我 们 什么 价值 ， 以 及 测试 
质量 为 什么 重要 。 


[1] 国情 咨文 (State of the Union) 是 美国 总 统 每 年 在 美国 国会 联席 会 议 召开 之 前 于 美国 国会 大 厦 中 的 众议院 发 表 的 报告 。 这 里 指 
下 文 对 软件 自动 化 测试 的 现状 做 概要 介绍 。 





译 者 注 


1.2 ”测试 的 价值 


来 认识 一 人 Marcus。Marcus 是 著名 的 编程 奇才 ， 两 年 前 刚 毕 业 ， 然 后 加 入 了 本 地 一 家 投行 的 IT 部 门 ， 为 银行 开 友 用 于 在 线 
自助 服务 的 Web 应 用 程序 。 作 为 团队 中 最 年 轻 的 成 员 ， 起 初 他 保持 低调 ， 集 中 精力 学 习 银 行 的 领域 知识 ， 熟 悉 “这 里 做 事 的 方 
式 ” 


几 个 月 后 ，Marcus 注 意 到 团队 的 工作 很 多 都 是 返工 : 修复 程序 员 的 错误 。(J 他 开始 关注 团队 修复 错误 的 类 型 ， 发 现 单元 测 
试 可 以 轻易 地 捕获 到 大 多 数 的 错误 。 当 他 感觉 到 哪里 存在 特别 容易 出 错 的 代码 时 ，Marcus 就 对 其 编写 单元 测试 。 

测试 帮助 我 们 捕获 错误 。 

一 段 时 间 以 后 ， 团 队 其 他 人 也 开始 到 处 编写 单元 测试 。Marcus 已 被 测试 感染 (test-infected) 了 ， 他 碰 过 的 代码 几乎 都 具 
有 相当 高 的 自动 化 测试 覆盖 率 。I 包 除了 在 第 一 次 时 犯错 ， 他 们 不 会 再 花费 时 间 修 复 过 去 的 错误 ， 待 修复 缺陷 的 总 数 在 下 降 。 测 试 
开始 清晰 可 见地 影响 着 团队 工作 的 质量 。 

自从 Marcus 编 写 第 一 个 测试 ， 已 经 过 去 近 一 年 了 。 在 前 往 公 司 圣诞 派对 的 路 上 ， 他 意识 到 时 光 匆 匆 ， 于 是 开始 回想 这 段 时 
间 内 发 生 的 变化 。 团 队 的 测试 覆盖 率 在 近 几 个 月 快速 提高 ， 达 到 了 98% 的 分 支 覆盖 率 。 


Marcus 曾 认为 他 们 应 该 推动 那个 数字 直到 100”%。 但 过 去 几 周 ， 他 打 定 了 主意 一 那些 缺失 的 测试 不 会 给 他 们 市 来 更 多 价 
值 ， 人 花费 更 多 精力 来 编写 测试 不 会 寓 来 额外 的 收益 。 许 多 没有 测试 履 兰 的 代码 ， 只 因 所 用 的 API 要 求实 现 某 些 接 口 ， 但 Marcus 
的 团队 并 未 用 到 它们 ， 那 么 何必 测试 那些 空 方法 桩 呢 ? 


100% 测 试 履 兰 率 不 是 目标 


100% 听 起 来 肯定 比 95% 要 好 ， 但 是 区 别 在 于 那些 测试 的 价值 对 你 可 能 是 微不足道 的 。 这 要 看 哪 种 代码 没有 被 测试 覆盖 ， 以 
及 你 的 测试 能 否 暴露 程序 的 错误 。100% 的 覆盖 率 并 不 能 够 确保 没有 缺陷 一 它 只 能 保证 你 所 有 的 代码 都 执行 了 ， 不 论 程序 的 行 
为 是 否 满足 要 求 。 与 其 追求 代码 覆盖 率 ， 不 如 将 重点 关注 在 确保 写 出 有 意义 的 测试 。 


团队 已 经 达到 稳定 水 平一 一 曲线 的 平坦 部 分 显示 出 额外 投资 的 收益 人 递减 。 在 本 地 的 Java 用 尸 组 会 议 中 ， 许 多 团队 报告 了 类 
似 的 经 验 ， 并 画 出 如 图 1.1 所 示 的 草图 。 


则 试 的 价值 


呈 
| 


编写 测试 的 工作 量 和 注意 


图 1.1 测试 越 多 ， 额 外 测试 的 价值 越 少 。 第 一 个 测试 最 有 可 能 是 针对 代码 最 重要 的 区 域 ， 因 此 带 来 高 价值 与 高 风险 。 当 我 们 为 
几乎 所 有 事情 编写 测试 后 ， 那 些 仍 然 没 有 测试 改 盖 的 地 方 很 可 能 是 最 不 重要 和 最 不 可 能 破坏 的 


高 级 软件 架构 师 Sebastian 曾 是 投行 的 顾问 ， 他 改变 了 Marcus 的 想法 。Sebastian 加 入 了 自助 服务 团队 ， 并 快速 地 成 为 初级 
成 员 的 导师 ， 包 括 Marcus 人 在 内 。Sebastian 这 位 老手 狐 似 使 用 过 几乎 上 所 有 主要 的 编程 语言 ， 用 以 开 友 Web 应 用 程序 。Sebastian 
编写 单元 测试 的 方式 影响 了 Marcus。 


Marcus 习 惯 于 先 写 代码 ， 在 提交 到 版 本 控制 系统 之 前 再 补充 单元 测试 。 但 Sebastian 的 风格 是 先 写 一 个 会 失败 (很 明显 是 
这 样 的 ) 的 测试 ， 再 写 足够 使 测试 通过 的 代码 ， 然 后 写 另 一 个 失败 的 测试 。 他 重复 这 个 循环 直到 完成 任务 。 


与 Sebastian 共 事 ，Marcus 意 识 到 目 己 的 编程 风格 开始 转变 。 他 的 对 象 结构 不 同 了 ， 代 码 看 起 来 稍微 不 同 了 ， 只 是 因为 他 
开始 从 调用 者 的 角度 来 审视 代码 的 设计 和 行为 了 。 


测试 帮助 我 们 针对 实际 使 用 来 塑造 设计 。 


想到 这 些 ，Marcus 洁 得 好 像 明日 了 一 些 道理 。 当 他 试图 用 语言 表达 出 他 的 编程 风格 是 如 何 改 变 的 ， 以 及 产生 了 哪些 效果 
时 ，Marcus 明 日 了 他 瑟 的 测试 不 仅仅 是 质量 保证 的 工具 ， 或 是 对 错误 及 回归 的 保护 。 测 试 作为 一 种 设计 代码 的 方式 ， 提 供 了 具 
体 的 目的 。 编 写 使 失败 测试 通过 的 代码 比 以 前 的 方式 简单 多 了 ， 而 且 该 做 的 也 都 做 了 。 


通过 明确 地 指出 所 需 的 行为 ， 测 试 帮助 我 们 避免 镀金 。 


主人 公 Marcus 的 经 历 正 如 许多 被 测试 所 感染 的 编程 人 员 一 样 ， 在 不 断 地 认识 和 理解 测试 。 我 们 经 常 因为 相信 单元 测试 有 助 
于 避免 乾 众 、 耗 时 的 错误 而 开始 编写 它们 。 随 后 我 们 会 学 到 ， 将 测试 作为 安全 网 只 是 等 式 的 一 部 分 ， 而 另 一 部 分 一 一 或许 是 更 
大 部 分 一 一 其 好 处 是 我 们 将 测试 表达 为 代码 的 思考 过 程 。 








大 多 数 开发 者 确实 都 理解 了 编写 自动 化 测试 的 好 处 。 不 太 能 达成 一 致 的 是 写 多 少 和 写 哪 种 测试 。 在 顾问 工作 中 ， 我 注意 到 大 
多 数 程序 员 都 同意 他 们 应 该 杀 目 去 编写 一 些 测试 。 相 类 似 ， 我 注意 到 几乎 没有 人 认为 应 该 达成 100% 才 兰 率 一 一 那 意 味 着 测试 将 
执行 生产 代码 中 每 个 可 能 的 执行 路 径 。 





那么 我 们 能 够 由 此 而 做 些 什么 吗 ? 大 多 数 人 同意 说 编写 一 些 测试 是 不 费 脑 筋 的 。 但 随 着 我 们 接近 完全 的 代码 覆盖 率 ， 我 们 不 
那么 确定 了 一 一 我 们 笑 不 多 已 经 为 一 切 都 编写 了 测试 ， 而 剩 下 的 没有 测试 的 代码 是 微不足道 ， 几 乎 不 会 破坏 的 。 这 束 是 某 些 人 
所 谓 的 收 荔 弟 减 ， 通 剃 显示 为 如 图 1.1 所 示 的 曲线 。 


换 句 话说 ， 疝 代码 基 增 加 100 个 精 挑 细 选 的 自动 化 测试 是 明显 的 改善 ， 但 当 我 们 已 有 30000 个 测试 时 ， 这 些 额外 的 100 个 测 
试 丈 无 足 轻重 了 。 投 行 的 年 轻 程 序 员 Marcus 在 与 导师 工作 时 友 现 ， 事 情 没 那么 人 简单。 之 前 的 原因 不 能 支持 所 谓 的 双 稳 仿 定律 


(Law of the Two Plateaus) : 


编写 测试 的 最 大 价值 不 在 于 结果 ， 而 在 于 编写 过 程 中 的 学 习 。 


双 稳 仿 定 律 涉及 Marcus 的 故事 中 对 于 测试 的 两 层 思 考 。 为 了 实现 测试 的 全 部 潜力 ， 我 们 要 肛 两 座 山 而 非 一 座 山 ， 如 图 1.2 所 
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编写 测试 的 工作 量 和 注意 
图 1.2 ”第 一 个 稳 态 表明 编写 更 多 更 好 的 测试 不 再 带 来 额外 的 价值 。 第 二 个 稳 态 进一步 展 升 ， 从 我 们 想法 的 改变 中 发 现 更 多 的 回 





报 将 测试 认为 是 丰富 的 资源 ， 而 不 仅仅 是 验证 工具 


只 要 我 们 认为 测试 仅仅 是 质量 保证 工具 ， 我 们 的 潜力 惑 被 图 1.2 中 下 面 的 弧 续 给 限制 位 了 。 将 我 们 对 测试 的 认识 转变 为 编程 
工具 (一 种 设计 工具 ) 能 促使 我 们 从 质量 稳 态 移动 到 第 二 个 以 测试 为 设计 工具 的 稳 态 。 


遗憾 的 是 ， 大 多 数 代码 似乎 沿 第 一 条 曲线 停 沛 不 前 ， 开 妈 者 并 未 肥力 去 使 用 测试 来 驱动 设计 。 相 应 地 ， 对 于 不 断 增 长 的 测试 
套件 的 维护 成 本 ， 开 友 者 没有 引起 足够 的 注意 。 


1.2.1 生产力 的 因素 


从 这 里 来 看 ， 最 大 的 问题 是 哪些 因素 影响 着 程序 员 的 生产 力 ， 在 这 个 动态 中 测试 扮演 什么 角色 ? 


编写 测试 最 快 的 方式 是 以 最 快 的 速度 打字 ， 但 却 不 关心 代码 中 重要 部 分 一 一 测试 代码 一 一 的 健康 。 然 而 ， 我 们 号 上 将 会 讨 
论 为 什么 应 该 论 时 间 培 育 你 的 测试 代码 、 对 重复 部 分 做 重 构 、 普 遍地 注意 它 的 结构 、 清 晰 度 和 可 维护 性 。 








测试 代码 往往 天 生 就 比 生产 代 码 简 单 。 中 无论 如 何 ， 如 果 你 偷工减料 ， 在 测试 代码 的 质量 上 留 下 技术 债务 ， 它 将 会 把 你 拖 
慢 。 本 质 上 ， 测 试 代码 的 重复 和 多 余 的 复杂 性 会 降低 你 的 生产 力 ， 抵 消 测试 带 来 的 正面 影响 。 


这 不 仅 天 乎 你 的 测试 可 读 性 ， 还 有 可 靠 性 和 可 信赖 性 ， 以 及 运行 所 需 的 时 间 。 图 1.3 展 示 了 测试 周围 的 影响 力 系统 。 
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图 1.3 ”多 个 关于 测试 的 影响 力 ， 它 们 直接 或 间接 地 影响 生产 力 


注意 我 在 图 中 标 出 的 两 个 对 生产 力 的 直接 影响 ， 它 们 是 反馈 环 长 度 和 调试 。 在 我 的 经 验 中 ， 这 两 者 是 在 键盘 上 消耗 程序 员 时 
间 的 罪魁 祸首 。 出 如果 你 在 错误 发 生 后 迅速 学 习 ， 那 么 花 在 调试 上 的 时 间 是 可 以 大 幅 避 免 的 返工 一 同时， 你 的 反馈 环 越 长 ， 
花 在 调试 上 的 时 间 越 多 。 





攀升 的 bug 修 复 成 本 


你 认为 修复 一 个 bug 的 平均 成 本 是 多 少 ? 伦敦 召开 的 2009XP 日 会 议 上 ，Google 的 Mark Sttiebeck 报 告 了 Goopgle 对 延迟 修复 缺陷 
的 成 本 估计 。 


Google 估 算出 在 程序 员 引 入 bug 后 马上 修复 它 要 花费 5 美元 。 同 样 的 缺陷 ， 如 果 当 时 逃脱 了 程序 员 的 眼睛 ， 而 是 在 运行 了 整个 
构建 后 才 发 现 它 ， 那 么 要 花费 50 美 元 来 修复 。 如 果 在 集成 测试 时 发 现 这 个 缺陷 ， 成 本 帮 升 至 500 美 元 ， 而 到 了 系统 测试 阶段 ， 成 


本 高 达 5000 美 元 。 
听 听 这 些 数 字 ， 无 颖 最 好 还 是 尽快 找到 bugre 双 1 


等 待 对 变更 进行 确认 和 验证 在 很 大 程度 上 牵扯 到 测试 执行 的 速度 ， 这 是 图 1.3 中 用 粗 体 强调 的 根本 原因 之 一 。 另 外 三 个 根本 
原因 都 会 影响 程序 员 的 调试 量 。 


屿 乏 可 读 性 目 然 会 降低 你 的 分 析 速 度 ， 并 且 鼓 励 你 打开 调试 器 ， 因 为 阅读 测试 代码 不 会 让 你 明日 一 一 太 难 理解 了 。 缺 之 可 


读 性 也 会 引入 更 多 的 缺陷 ， 因 为 很 难看 出 你 造成 的 错误 ， 而 缺陷 会 导致 更 多 的 调试 工作 。 


屿 陷 逃逸 数量 增多 的 另 一 个 因素 是 测试 结果 的 准确 度 。 你 若 要 能 够 依赖 于 测试 套件 去 识别 引入 的 错误 ， 那 么 准确 度 是 一 个 基 
本 要 求 。 剩 下 的 两 个 影响 生产 力 的 测试 相关 根本 原因 ， 都 会 直接 影响 测试 准确 度 ， 它 们 叫做 可 信赖 性 和 可 靠 往 。 为 了 测试 报告 的 
准确 性 ， 测 试 需要 断言 它们 的 承诺 ， 并 以 可 靠 、 可 重复 的 方式 提供 断言 。 


通过 关注 对 生产 力 的 影响 力 ， 你 可 以 扩展 质量 稳 仿 。 使 程序 员 变 得 高 效 的 关键 正 是 这 些 已 经 识别 出 的 根本 原因 。 高 产 的 先决 
条 件 是 你 足够 了 解 你 的 工具 ， 而 不 是 持续 分 散 你 的 注意 力 。 一 旦 你 了 解 了 编程 语言 ， 你 可 以 浏览 其 核心 APl。 当 你 熟悉 了 问题 
域 ， 玖 专注 于 根本 原因 一 一 可 读 性 、 可 靠 性 、 可 信赖 性 和 测试 的 速度 。 





这 也 是 本 书 剩余 大 部 分 将 要 围绕 的 内 容 
寺 续 使 用 这 种 工作 方式 ， 以 确保 可 维护 性 。 


帮助 你 提高 对 测试 代码 可 读 性 、 可 信赖 性 和 可 靠 性 的 意识 和 感觉 ， 并 确保 你 能 





在 那 之 前 ,我 们 来 解释 图 1.2 中 的 第 二 条 曲线 。 


1.2.2 设计 潜力 的 曲线 





假设 你 先 写 了 最 重要 的 测试 一 一 针对 最 常见 和 基本 的 场景 ， 以 及 软件 染 构 中 的 关键 部 位 。 


你 的 测试 质量 很 高 ， 你 大 胆 地 将 重复 都 重 构 掉 ， 保 持 测试 精益 且 可 维护 。 现 在 想象 一 下 ， 你 积 罕 了 如 此 高 的 测试 覆 茵 率 ， 唯 
一 没 测 到 的 地 方 只 是 那些 直接 针对 字段 的 访问 器 。 平 心 而 论 ， 为 那些 地 方 写 测 试 没 什么 价值 。 因 此 ， 之 前 的 做 法 倾 则 于 收益 递减 
一 一 你 已 经 不 能 再 从“ 仅仅 ”编写 测试 这 件 事 中 获取 价值 了 。 


这 是 由 于 我 们 不 做 的 事情 而 造成 的 质量 稳 仿 。 之 所 以 这 么 说 是 因为 想 要 达到 更 高 的 生产 力 ， 你 需要 换个 思路 去 考虑 测试 。 为 
了 找 回 丢掉 的 潜力 ， 你 需要 从 编写 测试 中 找到 完全 不 同 的 价值 一 一 价值 来 自 于 创新 及 设计 导向 ， 而 非 防止 回归 缺陷 的 保护 及 验 
证 导 疝 。 


总 而 言 之 ， 为 了 能 同时 达到 两 个 稳 态 ， 从 而 完全 发 挥 测试 的 潜力 ， 你 需 


1. 像 生 严 代码 一 样 对 待 你 的 测试 代码 一 一 大 胆 地 重 构 、 创 建 和 维护 高 质量 测试 ， 你 目 己 要 对 它们 有 信心 。 


2. 开 始 将 测试 作为 一 种 设计 工具 ， 指 导 代 码 针 对 实际 用 途 进行 设计 。 


jxf 


如 前 所 述 ， 前 者 造成 了 大 多 数 程 序 员 在 编写 测试 时 会 不 知 所 措 ， 无 法 顾及 高 质量 ， 或 降低 编写 、 维 护 、 运 行 测试 的 成 本 。 
也 是 本 书 的 重点 一 一 编写 优秀 的 测试 。 


也 就 是 说 我 们 不 会 花 很 多 时 间 去 讨论 利用 测试 作为 设计 的 方面 。 中 我 只 是 想 让 你 对 这 种 动态 和 工作 方式 有 个 全 面 的 了 解 ， 那 
我 们 详细 说 说 这 个 话题 再 前 进 吧 。 


[1 出 于 一 些 原因 ， 人 们 称 之 为 错误 、 缺 陷 、bug 或 问题 。 

D] 测试 感染 (test-infected) 这 个 术语 ， 由 Erich Gamma 和 Kent Beck 提出 ， 出 自 1998 年 《Java Report》 的 文章 ，《Test-Infected: 
Ptogrammets Love Writing Tests.》 。 

[3] 例如 ， 很 少 有 人 在 测试 中 使 用 条 件 语 句 、 循 环 等 。 

由 有 许多 人 说 会 议 是 生产 力 的 终极 杀手 ， 不 过 那 是 在 别 的 书 里 。 

[5] 碰巧 我 写 过 一 本 关于 该 主题 的 宝 书 一 一 《测试 驱动 开发 的 艺术 》 (Test Driven) 。 另 一 本 不 错 的 书 是 《测试 驱动 的 面向 对 象 软 
件 开发 》 (Growing ObjectOtiented Software，Guided by Tests， 作 者 Steve Freeman，Nat Pryce， 机 械 工 业 出 版 社 ，2010) 。 


1.3 ”测试 作为 设计 工具 


传统 上 ， 程序 员 编 写 的 目 动 化 测试 被 看 做 是 质量 保证 工作 ， 用 于 在 编写 的 时 候 验 证 实现 的 正确 性 ， 以 及 将 来 代码 进化 的 时 候 
验证 正确 性 。 这 融 是 将 测试 作为 验证 工具 一 一 你 设想 一 份 设计 ， 编 写 代 码 实现 ， 编 写 测试 验证 实现 是 否 正确 。 

使 用 目 动 化 测试 作为 设计 工具 将 世界 颐 倒 过 来 了 。 当 你 用 测试 设计 代码 时 ， 你 将 典型 的 “设计 ， 编 码 ， 测 试 ” 序 列 变换 
为 “测试 , 编码， 设计”。 是 的 ， 束 是 那样 。 测 试 先 于 编码 ， 并 以 追溯 性 的 设计 活动 来 得 出 结论 。 那 结论 性 的 设计 活动 称 为 重 
构 ， 序 列 变 为 “测试 ,编码 ， 重 构 ”， 如 图 1.4 所 示 。 





(重复 . 


图 1.4 ”测试 驱动 开发 的 过 程 ， 先 是 编写 失败 的 测试 ， 编 写 代 码 以 通过 测试 ， 重 构 代 码 来 改进 设计 
如 果 你 对 这 有 点 耳 熟 ， 大 概 是 听 说 过 测试 先行 编程 或 测试 驱动 开发 (Test-Driven Development，TDD) 。 上 这 就 是 我 们 
所 要 讨论 的 ， 那 我 们 也 这 么 叫 吧 。 
1.3.1 测试 驱动 开发 


TDD， 如 图 1.5 所 示 ， 是 一 种 很 有 章法 的 编程 技术 ， 它 基于 一 个 简单 的 想法 : 在 编写 出 能 够 证 明代 码 存 在 的 失败 测试 之 前 ， 
不 瑟 生 产 代码 。 这 也 是 它 有 时 被 称 为 测试 先行 编程 的 原因 。 


不 止 这 些 。 先 写 测试 ,会 同 测试 所 期 望 的 方向 来 驱动 生产 代码 的 设计 。 这 会 市 来 以 下 令 人 满意 的 后 果 : 
: 代码 变 得 可 用 一 一 代码 的 设计 和 API 适 合 于 你 的 使 用 场景 。 


生产 代码 仅仅 实现 场景 所 需要 的 功能 。 





. 代码 变 得 精益 

首 务 ， 无 论 你 工作 在 系统 蓝图 的 哪 一 部 分 ， 无 论 其 他 组 件 、 类 或 接口 仔 在 与 个 ， 你 一 定 是 在 为 一 个 具体 的 场景 来 设计 解决 方 
。 你 将 该 场景 翻译 为 一 个 可 执行 的 例子 ， 以 自动 化 单元 测试 的 万 式 。 运 行 测试 ， 看 看 它 失 败 ， 你 具有 了 一 个 使 之 通过 的 清晰 目 
标 ， 只 编写 足够 的 生产 代码 一 一 不 要 多 写 。 


料 










开始 
通过 编写 
运行 所 有 测试 > 二 测试 通过 ? 一 生产 代码 

: 使 测试 通过 


写 一 个 
新 测试 


运行 所 有 测试 





| 重 构 生 产 代码 pa 
运行 所 有 测试 id ” 测试 通过 ? 
| | 和 测试 代码 是 mn 


图 1.5 ”测试 驱动 开发 是 一 个 循环 过 程 。 先 写 失 败 的 测试 ， 使 之 通过 ， 然 后 重 构 代码 使 意图 更 明确 ， 同 时 减少 重复 。 每 一 步 过 程 
中 ， 你 都 不 断 地 运行 测试 ， 确 保 目 前 的 进展 


将 场景 刻画 为 可 执行 的 测试 代码 是 一 种 设计 行为 。 测 试 代码 成 为 生产 代码 的 调用 者 ， 使 你 在 还 没 写 任何 代码 之 前 融 验 证 你 的 
设计 。 用 具体 例子 的 形式 来 表达 需求 是 一 种 强大 的 验证 工具 一 一 我 们 只 能 通过 将 测试 作为 设计 工具 才能 获取 价值 。 


其 次 ， 严 格 遵循 规则 ， 仪 仅 编写 足以 使 测试 通过 的 代码 ， 你 会 保持 设计 简单 并 适合 目的 。 没 有 贸 金 的 迹 乏 ， 因 为 任何 代码 都 
场景 一 一 来 覆 荔 和 保证 。 代 码 质 量 罪魁 祸首 之 一 ， 以 及 使 开 友 者 生产 力 停 冲 的 主要 因素 ， 束 是 称 为 偶 友 复杂 性 。 








偶 友 复杂 性 是 不 必要 的 复杂 性 。 可 以 通过 替换 为 简单 的 设计 来 避免 忆 ， 同 时 仍然 满足 需求 。 有 了 时 我 们 喜欢 通过 产 出 这 种 复杂 
设计 来 展示 目 己 的 精神 能 力 ， 却 使 目 己 都 理解 不 了 那些 设计 。 我 打赌 你 也 认识 到 目 己 的 原始 本 能 了 。 复 杂 设 计 会 扼杀 生产 力 ， 偶 
及 复杂 性 也 会 事与愿违 。 


测试 指出 缺陷 或 代码 中 缺失 的 功能 ， 只 写 足 以 使 测试 通过 的 代码 ， 严 格 地 向 简单 设计 [来 重 构 ， 这 三 者 的 组 合 极其 强大 ， 可 
以 将 偶发 复杂 性 消灭 在 萌芽 中 。 这 不 是 魔法 药剂 ， 程 序 员 的 设计 观念 和 经 验 会 影响 你 最 终 得 到 的 设计 。 


天 于 TDD 远 不 止 这 些 一 一 很 多 书 整 本 都 在 讲 这 种 方法 ， 包 括 我 目 己 写 的 《测试 驱动 开 友 的 艺术 》 (Test Driven) ， 以 及 最 
近 的 《测试 驱动 的 面向 对 象 软件 开 友 》 (Growing Object-Oriented Software，Guided by Tests， 作 者 Steve 
Freeman，Nat Pryce) 。 如 果 你 想 要 更 紧凑 的 TDD 介 绍 ， 我 推荐 你 读 《 测 试 驱动 开发 : 实战 与 模式 解析 》D (Test Driven 
Development: By Example， 作 者 Kent Beck，2004) 。 


有 这 么 多 具体 对 TDD 的 介绍 ， 我 们 这 里 惑 长 话 短 说 ， 你 可 以 参考 那些 书 来 进行 更 深入 的 探索 。 但 我 在 这 里 讨论 TDD 的 原因 
是 ， 它 与 我 们 关于 优秀 测试 的 主题 紧密 相关 一 一 称 为 行为 驱动 开发 (Behavior-Driven Development，BDD) 的 编程 风格 。 





1.3.2 行为 驱动 开 友 


你 可 能 听 说 过 BDD， 即 行为 驱动 开 友 。 昌 然 过 去 的 几 十 年 间 ， 人 们 曾 用 过 测试 先行 的 方式 ,但 20 世 纪 90 年 代 才 真正 提出 测 


试 驱动 开 友 的 万 法 。 


大 约 10 年 过 去 了 ， 身 在 伦敦 的 顾问 Dan North， 首 先 意 识 到 了 TDD 思 想 和 词汇 表 中 所 讲 的 “测试 ”会 误导 人 们 ， 然 后 成 功 
地 将 测试 先行 编程 推进 了 一 步 。Dan 将 这 种 风格 的 TDD 命 名 为 行为 驱动 开 友 ， 在 他 2006 年 上 友 表 于 《Better Software》 的 文章 
中 ， 他 是 这 样 介绍 BDD 的 : 


我 突然 想到 人 们 对 TDD 的 误解 几乎 总 是 回 到 “测试 ”这 个 词 。 





并 不 是 说 测试 不 是 TDD 的 本 质 所 产生 的 函数 和 方法 是 一 种 有 效 确 保 代 码 工 作 的 方式 。 然 而 ， 如 果 函 数 和 方法 不 能 全 面 


地 描述 系统 的 行为 ， 那 么 它们 会 带 给 你 一 种 庶 假 的 安全 感 。 


在 我 处 理 TDD 时 ， 我 开始 使 用 “行为 ”替代 “测试 ”一 词 ， 我 发 现 它 似乎 不 仅 合适 ， 而 且 所 有 的 教练 (coaching) 问题 都 奇 
妙 地 解决 了 。 我 现在 对 TDD 的 一 些 问题 有 了 答案 。 给 测试 命名 变 得 简单 一 一 一 勿 话 描述 下 一 个 你 感 兴趣 的 行为 。 测 试 的 数量 变 
你 只 能 在 一 句 话 中 描述 这 么 多 行为 。 当 测试 失败 ， 你 仅 需 要 重 走 一 下 上 述 流程 一 一 要 么 你 引入 了 一 个 bug， 要 人 么 
改变 了 ， 或 者 测试 不 再 是 相关 的 。 





得 毫 无 意义 


和 
我 发 现 从 思考 测试 到 思考 行为 ， 这 种 转换 如 此 深刻 ， 我 开始 改称 TDD 为 BDD 或 行为 驱动 开发 。 


Dan 开 始 编写 和 讨论 BDD 之 后 ， 全 球 软件 开发 者 社区 中 的 其 他 人 也 纷纷 将 想 出 的 各 种 实例 驱动 、 行 为 需求 导向 的 想法 融入 
Dan North 的 BDD 中 。 于 是 , 今天 的 BDD 语 境 和 领域 远 远 超出 了 代码 一 一 最 引 人 注 目的 是 将 BDD 提 升 到 需求 层面 ， 与 业务 分 析 
和 需求 行为 结合 起 来 。 





羽 BDD 实 跤 者 证 明 是 有 效 的 一 个 特殊 概念 ， 是 利用 验收 测试 进行 由 外 向 内 的 开 上 有 友 。 这 是 《Cucumber: 行为 驱动 开发 指 
责 》 (The Cucumber Book: Behaviour-Driven Development for Testers and Developers) 一 书 作 者 Matt Wynne 和 
Aslak Hellesgy 所 描述 的 : 


通过 将 优秀 的 TDD 实 践 者 的 良好 习惯 正式 化 ， 测 试 驱 动 开 发 衍生 出 了 行为 驱动 开发 。 优 秀 的 TDD 实 践 者 由 外 向 内 地 思考 ， 
他 们 先 编 写 一 个 失败 的 客户 验收 测试 ， 用 于 从 客户 视角 描述 系统 。 作 为 BDD 实 践 者 ， 我 们 小 心地 以 例子 的 形式 编写 验收 测试 ， 
使 任何 团队 成 员 都 能 够 理解 。 我 们 遵循 这 个 过 程 ， 编 写 例子 来 从 业务 干系 人 那里 获得 反馈 ， 在 动手 之 前 就 能 了 解 我 们 是 否 在 构建 
正确 的 东西 。 


作为 这 种 开 友 方式 的 佐证 ,许多 BDD 工 具 和 框架 如 雨后春笋 般 ， 纷 纷 将 基础 的 想法 、 实 践 和 约定 藤 入 到 软件 开 友 者 的 工具 
链 中 。 我 们 会 在 第 8 章 见 到 那些 工具 。 


当 我 们 在 本 书 这 到 “优秀 测试 ”时 ， 记 住 Dan 的 领情 ， 注 意 措 群 。 词 汇 表 很 重要 。 


[1 或 者 你 读 过 Marcus 及 其 导师 Sebastian 的 故事 ， 就 在 前 几 页 ……: 
[2] 简单 设计 与 过 分 简单 的 (simplistic) 设计 是 不 同 的 。 


[3] 本 书 已 由 机 械 工 业 出 版 社 引 进出 版 ，ISBN: 978-7-111-42386-7。 


1.4 小结 


"牛仔 式 编程 ”由 来 已 久 ， 那 时 候 程 序 员 随意 地 编码 ， 丈 算 从 马鞍 上 跌落 也 绝 不 写 测 试 来 接 住 目 己 。 如 今 ， 开 发 者 测试 与 目 
动 化 测试 已 司空 见 惯 ， 即 使 不 是 标准 实践 ， 也 绝对 是 热门 话题 。 为 你 的 代码 编写 彻 抵 的 目 动 化 测试 套件 ， 其 价值 是 不 可 否认 的 。 


本 章 中 你 熟悉 了 双 稳 仿 定律 。 第 一 个 稳 仿 ， 程 序 员 从 测试 中 获得 的 价值 是 有 限 的 ， 因 为 你 已 经 具备 了 完全 的 测试 覆 匡 率 。 但 


你 还 可 以 更 进一步 。 


注重 测试 质量 的 程序 员 不 只 关注 第 一 个 稳 仿 ， 而 是 脑 准 项 峰 。 具 备 测试 是 一 回 事 ， 具 备 优秀 测试 是 另 一 回 事 。 这 丈 是 你 阅读 
本 书 的 原因 ， 也 是 我 们 将 在 剩 下 的 章 世 中 接受 的 挑战 。 


毕竟 ， 如 果 你 一 路 登 项 而 非 停留 在 半山 腰 ， 你 肯定 会 获得 比 登 山 更 多 的 乐 西 。 


第 2 章 ， 寻 求 优秀 


本 章 内 容 包括 : 

测试 怎样 才 算 “优秀 ” 
测试 相关 的 行为 
:可靠 测试 的 重要 性 


我 们 正在 学 习 优 秀 的 测 坛 。 我 们 想 要 学 习 如 何 识 别 优秀 的 测试 ， 书 写 优秀 的 测试 ， 改 进 不 那么 优秀 的 测试 ， 这 样 它 们 残 能 成 
为 优秀 的 测试 ， 或 至 少 接近 优秀 。 间 题 是 ， 怎 么 才能 算 “ 优 秀 ”? 有 哪些 神奇 的 要 素 ? 以 下 几 个 方面 要 考虑 ， 包 括 : 


` 测试 代码 的 可 读 性 和 可 维护 性 

“ 代码 在 项 目 中 及 特定 源 代码 中 的 组 织 方式 
` 测试 所 检查 的 内 容 

测试 的 可 靠 性 及 可 重复 性 

` 测试 对 测试 替身 的 使 用 

本 章 将 仔细 研究 这 些 方面 。 


上 述 列 表 还 不 够 全 面 。 影 响 测试 质量 的 因素 是 无 穷尽 的 。 同 样 ， 一 些 因素 并 非 在 各 种 情况 下 都 起 作用 。 对 一 毕 测 试 来 疯 ， 执 
至 天 重要 的 ， 但 对 另 一 些 来 况 ， 极 大 专注 才 是 天 键 。 


此 外 ， 测 试 代码 的 质量 取决 于 观察 者 的 眼睛 。 如 同 代码 一 样 ， 个 人 偏好 天 乎 “优秀 ”的 定义 一 一 我 不 会 忽略 偏见 的 存在 。 
我 也 不 会 在 本 书 中 假 污 我 能 避免 目 己 的 偏见 和 喜好 。 尽 管 我 会 尽量 避免 因 人 而 异 的 问题 ， 但 你 仍 会 友 现 很 多 章 证 清晰 地 凸显 了 我 
的 个 人 观点 。 我 总 得 没关系 。 毕 竟 ， 我 从 各 位 软件 牛人 那里 学 到 了 有 关 代 码 ， 特 别 是 测试 代码 的 内 容 ， 形 成 了 基于 个 人 经 验 的 诚 
恳 (和 固执 己见 ) 看 法 ， 这 是 我 能 提供 的 最 好 的 东西 。 


6 责 声明 之 后 ， 我 们 来 讨论 一 下 测试 质量 的 几 个 万 面 ， 看 看 哪些 与 我 们 的 兴趣 相关 。 


2.1 可 读 的 代码 才 是 可 维护 的 代码 


昨天 我 从 咨询 工作 现场 回 到 办 公 室 ， 与 同事 谈 起 他 近期 要 参加 的 1K 大 赛 。 这 种 比赛 是 demo party 的 传统 证 目 一 一 demo 


party 是 一 种 极 客 聚 会 ， 黑 客 们 会 市 着 计算 机 、 有 睡袋 、 能 量 饮 料 在 巨大 的 舞台 上 待 上 整个 周末 。 
从 第 一 届 开 始 ， 黑 客 们 融 互 相 较 劲 ， 在 很 多 人 认为 过 时 的 硬件 上 和 舞 弄 看 疯狂 的 技巧 来 制作 3D 动 画 。 


这 种 动画 的 一 个 典型 约束 是 大 小 。 在 我 同事 要 准备 的 比赛 中 ， 其 名 字 1K 意 味 着 代码 编译 为 二 进 制 之 后 的 大 小 不 能 超过 1024 


字 节 。 


对 ， 你 没 听 错 一 一 1024 字 书 。 为 了 把 有 用 的 程序 六 入 这 人 么 小 的 空间 ， 参 赛 者 需要 使 用 各 种 奇 拉 淫 区。 例如 ， 一 个 使 代码 更 
索 次 的 种 见 手段 是 让 多 个 变量 使 用 相同 的 名 字 一 一 因为 这 样 代码 压缩 得 更 好 一 些 。 大 疯狂 了 。 





生成 的 代码 也 同样 疯狂 。 当 他 们 将 代码 压缩 到 1024 字 节 时 ， 源 代码 已 经 面目 全 非 了 。 你 几乎 认 不 出 是 使 用 了 哪 种 编程 语 
言 ! 它 基本 上 是 一 个 只 写 (write-only) 代码 库 一 一 一 旦 开始 压缩 ， 你 融 无 法 再 改变 功能 ， 因 为 你 分 辨 不 出 要 编辑 什么 ， 也 不 类 
在 哪里 编辑 和 如 何 编辑 。 


给 你 一 个 鲜 活 的 例子 体会 一 下 ， 这 是 最 近 JS 1K 比 赛 中 实际 提交 的 代码 ， 选 用 的 语言 是 JavaScript， 而 它 需 要 六 到 1024 字 节 
内 : 


<SCcCYIDPt>wlLth(daocument .bodqv.style) {margin="0px";overflow="hidden";)} 

Var w=window.innerWidth;var h=window.innerHeight;var ca=document. 
getElementById("c") ;ca.width=w;ca.height=h;var c=ca.getContext ("2Q" ) ; 
m=Math; fs=m.sin;fc=m.cos;fm=m.max;setIinterval(d,30);function p(x,y,z){ 
return{x:XxX,YVy:y,Z:2};}function s(a,z) {r=w/10;R=w/3;b=-20*fc(a*S+t).; 
return p(w/2+(R*fc(a)+r*fs(zZ+2*t))/zZ+fc(a)*b,h/2+(R*fs(a))/z+fs(a)*b).; 
}function ql(a,da,z,dz) {var v=[s(a,z),s(a+da,z),s(a+da,z+dz),s(a,z+dz)] 
PC Deqrnpath(}) emveTolvidl LU ED InN vo. LineTo(lvlil] i wl1] 
DO 
REGETUS OW Dn) Se, LISOEVLE= "FOV" Var m=30 var ioe0rYvar Qe 
2*Math.PI/n:var dz=0.25;for(var z=Z+8;ZzZ>Z;2Z-=dz) {for(var 1=0;1<n;1++)Ift 
EOo=1/ AEMml (tO 7 =3. .11) ?1s IEO0=FNU0 SY Ero 2 ar R=L205s{FoOG 
Math.abs(fs(1/n*2*3.14+t))))>>0;k*=(0.55+0.45*fc( (1/n+0.25)*Math.PI*5) 


) ; K=k>>0;c.fillStyle="rgb("+k+", "+k+","+k+")";q(a,da,z,dz);1if (1%3==0)t{ 
c.f1l1lStyle=s"#000":a(a,dayl10, zdz) :at=sdas; J 2Z==0.05;1f(Z<=dz2)Z+=dz» ] 
ns 


当然 ， 这 种 情形 比 一 般 软 件 公司 中 的 极端 情况 还 要 高 几 个 量 级 。 但 我 们 都 在 工作 中 见 过 让 人 头 大 的 代码 。 有 时 我 们 称 这 种 代 
码 为 遗留 代码 ， 因 为 那 是 从 别人 那里 继承 下 来 并 接手 维护 的 一 一 只 是 它 太 难 维护 了 ， 每 次 试图 去 理解 它 都 令 人 头疼 。 维 护 这 种 
不 可 读 的 代码 是 一 个 苦 差事 ， 因 为 我 们 花 了 这 么 大 精力 去 理解 我 们 看 到 的 代码 。 不 仅 如 此 。 研 究 表明 ， 较 差 的 可 读 性 与 缺陷 密度 
密切 相关 。 [| 





目 动 化 测试 是 防止 缺陷 的 有 效 保护 。 遗 憾 的 是 ， 目 动 化 测试 也 是 代码 ， 其 可 读 性 也 很 容易 变 差 。 难 以 阅读 的 代码 也 残 难 以 测 
试 ， 导 致 更 难为 之 编写 测试 。 而 且 ， 我 们 编写 的 测试 还 远 远 达 不 到 优秀 的 地 步 ， 因 为 我 们 需要 围绕 拙 务 的 结构 、 难 懂 的 API 调 用 
及 非 测 试 友好 的 结构 来 组 织 代码 。 


我 们 建立 的 代码 可 读 性 (几乎 令 人 哆 哮 ) 对 代码 可 维护 性 具有 可 怕 的 影响 。 那 么 测试 代码 的 可 读 性 又 如 何 呢 ” 有 多 大 差别 ， 
或 者 有 郑 别 吗 ” 我 们 看 个 难 读 的 测试 代码 的 通俗 示例 ， 如 代码 清单 2.1 所 示 。 


代码 清单 2.1 ”并非 复杂 代码 才 缺 乏 可 读 性 


GTest 
public void flatten() 上 throws Exception { 


Env e = Env.getInstance(); 
Structure k = e.newStructure(): 
Structure Vv = e.newStructure().: 


an mn = Lys 

Lit :my = L000Ds 

for (int i = 0; i < n; ++i) { 
k.append(e.newFixnum(1));} 
Vv.append(e.newFixnum(1)); 


} 


Structure t = (Structure) k.zip(e.getCurrentContext (), 
new IObject[] {v}, Block.NULL BLOCK); 
V = (Structure) t.flattenl(e.getCurrentContext()); 


assertNotNull (Vv); 


这 个 测试 在 检查 什么 ? 你 敢 说 它 很 容易 理解 吗 ? 想象 目 己 是 团队 里 的 新 人 一 一 你 要 花 多 久 才 能 明日 测试 的 意图 ? 如 果 该 测 
试 突然 失败 ， 你 要 如 何 调查 代码 才能 搞 清 状 况 ? 根据 我 对 丑陋 代码 的 感 客 ， 我 打赌 你 立即 可 以 从 这 个 烂 测试 中 识别 出 一 些 可 以 改 
进 的 地 万 一 一 可 读 性 是 一 个 弟 见 的 改进 万 面 。 





[1] Raymond P.L. Buse, Westley R. Weimetr. “ Learning a Metric for Code Readability. IEEFE Transactions on Soft-ware Enpineering, 09 


Nov. 2009. IEEE computer Society Digital Library. IEEE Computer Society, http://doi.ieeecomputersociety.org/10.1109/TSE.2009.70 


2.2 ”结构 有 助 于 理解 事物 


我 看 过 无 数 的 代码 库 ， 痛 并 快乐 着， 天 才 的 美妙 步伐 并 没有 在 那些 源 文 件 中 入 征 。 某 些 文件 从 未 跳 转 到 另外 的 源 文件 ， 因 为 
它 的 全 部 内 容 都 在 一 起 一 一 所 有 代码 和 多 辑 ， 比 如 ，Web 表 单 的 提交 全 部 都 放 在 一 个 源 文件 里 面 。 我 曾经 加 专 地 试图 打开 一 个 
超大 的 源 文件 而 导致 文本 编辑 器 朋 演 。 我 还 见 过 一 个 Web 应 用 程序 报错 ， 是 由 于 JSP 文 件 脱 胀 得 太 大 ， 导 致 生 成 的 字 证 码 违反 了 





Java 类 文件 的 规 学 。 不 仅仅 说 结构 是 有 用 的 一 一 缺乏 结构 更 是 有 害 的 。 
对 于 这 些 又 奥 又 长 的 源 代码 ， 基 本 上 没 人 愿意 页 它们 。 即 使 最 简单 的 概念 变化 都 难以 映射 到 你 面前 的 源 代码 上 。 没 有 结构 可 


以 让 你 的 大 脑 依靠 。 无 法 分 而 治之 一 一 你 不 得 不 在 脑海 里 处 理 整 件 事 情 ， 或 者 准备 好 用 脑 伐 撞墙 。 





如 图 2.1 所 示 ， 你 不 是 想 随便 要 一 个 结构 来 帮助 理解 。 你 需要 这 样 的 结构 一 一 用 与 你 的 大 脑 和 心智 相 匹 配 的 方式 来 分 解 事 
物 。 讶 目地 将 代码 外 化 为 单独 的 源 文件 、 类 或 万 法 ， 在 一 定时 间 内 能 减少 代码 的 数量 ， 从 而 降低 大 脑 的 负担 。 但 是 那 并 不 足以 隔 
离 和 理解 我 们 感 兴趣 的 程序 逻辑 。 于 是 你 需要 一 个 有 意义 的 结构 。 










概念 变化 难以 
映 尉 到 代码 上 


任何 变化 都 意味 着 
一 次 破坏 -修复 










代位 缺乏 结构 





代码 将 具备 更 多 结构 
i 将 它 切 成 小 块 





图 2.1 不 仅 要 有 具备 结构 





而 且 要 有 用 的 结构 


当面 对 庞然大物 ， 即 没完 没 了 的 源 代码 清单 时 ， 一 个 明显 的 解决 方案 是 将 它们 切 成 碎片 ， 将 代码 块 抽 取 到 方法 中 。 可 以 将 一 
个 包含 500 行 代码 的 巨型 类 分 解 为 10 个 类 中 的 几 十 个 方法 ， 将 万 法 的 平均 长 度 降 低 到 10 行 以 下 。 那 会 向 代码 中 引入 更 多 结构 
至 少 编译 器 这 么 认为 。 这 样 你 也 能 够 在 屏幕 上 看 见 整个 万 法 ， 而 不 用 上 下 浴 动 。 





但 是 如 果 分 解 庞 然 大 物 的 边界 不 其 合理 一 一 如 果 它 们 没 能 映射 到 领域 和 抽象 上 一 一 我 们 可 能 会 适得其反 ， 因 为 现在 各 个 概 
念 之 间 在 物理 上 可 能 比 之 前 更 加 分 散 ， 反 而 增加 了 你 在 源 文件 之 间 来 回 切 换 的 时 | 间 。 很 简单 。 重 要 的 是 代码 结构 是 否 有 助 于 你 快 
速 而 可 靠 地 找到 高 层 概念 的 代码 实现 所 在 。 


对 于 这 种 现象 ， 以 测试 代码 为 例 是 极 好 的 。 假 设 你 的 应 用 程序 被 自动 化 测试 相当 好 地 窗 羡 着 一 一 但 就 一 个 自动 化 测试 。 想 
象 一 下 ， 这 个 测试 只 有 一 个 巨大 的 测试 方法 ， 花 了 半 小 时 执行 应 用 程序 的 所 有 远 辑 和 行为 。 假 设 因 为 你 在 程序 内 部 对 邮件 地 址 的 
显示 方式 做 了 一 后 调整 ， 但 是 却 把 一 些 东 西 搞 乱 了 ， 因 此 测试 最 后 失败 了 ， 如 图 2.2 所 示 。 这 是 个 bug。 接 下 来 会 怎样 ? 


程序 员 出 错 
和 开始 等 待 30 分 钟 


巨型 测试 下 


图 2.2 ”缓慢 的 反馈 确实 是 生产 率 的 杀手 






我 能 想象 这 要 花 一 段 时 间 才 能 在 测试 代码 中 找到 确切 的 出 错位 置 。 测 试 代码 缺乏 结构 ， 无 助 于 你 理 清 相 互 的 影响 、 某 个 对 象 
是 在 哪里 初始 化 的 、 出 错时 某 个 变量 的 值 是 多 少 ， 等 等 。 最 终 ， 当 你 设法 找到 和 修正 了 错误 ,你 只 得 再 次 运行 整个 测试 一 一 整 
整 30 分 钟 一 一 来 确保 你 真 的 修复 了 问题 ， 并 且 在 这 个 过 程 中 没有 再 破坏 其 他 东西 。 

继续 这 个 思考 实验 ， 设 想 快 速 地 倒退 到 一 个 小 时 前 ， 此 时 你 正 要 改动 另 一 处 。 这 次 你 学 形 了 ， 你 要 小 心地 确保 目 己 理解 了 当 


前 的 实现 ， 保 证 目 己 做 了 正确 的 改动 。 那 你 会 怎么 做 ? 去 阅读 代码 ， 特 别 是 精读 测试 代码 ， 它 会 具体 地 告诉 你 生产 代码 的 预期 行 
为 。 只 是 你 找 不 到 测试 代码 的 相应 部 分 ， 因 为 它 缺 乏 结 构 。 


CR 


你 需要 的 是 专注 的 测试 ， 它 可 读 、 可 达 、 可 理解 ， 这 样 你 才 和 
` 找到 与 手 上 任务 相关 的 测试 类 


: 从 那些 类 中 识别 出 合适 的 测试 方法 


: 理解 测试 方法 中 对 象 的 生命 周期 


天 注 测试 的 结构 并 确保 它 有 用 ， 你 残 可 以 做 到 这 几 点 。 当 然 ， 具 备 有 用 的 结构 还 不 够 。 


2.3 ”如 果 测 试 了 销 i 吴 的 东西 束 不 好 了 


在 阅读 和 调试 代码 以 找 出 不 展 系 统 行为 的 原因 时 ， 我 却 最 终 不 止 一 次 地 回 到 了 开始 的 地 万。 在 找 bpug 的 过 程 中 ， 尤 其 容易 忽 
略 的 一 个 烦人 细节 是 测试 的 内 容 。 在 挖掘 代码 时 ， 我 要 做 的 头 一 件 事情 往往 是 运行 所 有 测试 ， 让 它 告诉 我 哪些 正常 ， 哪 些 不 正 
党 。 有 了 时 我 太 过 相信 测试 的 名 称 。 有 时 那些 测试 其 实 完全 是 在 测试 不 同 的 东西 。 


这 与 民 好 的 结构 有 关 一 一 如 果 测 试 的 名 字 错 误 地 表达 了 要 测试 的 内 容 ， 那 束 像 是 跟着 错误 的 路 标 驾 驶 。 你 应 该 能 够 信任 你 
的 测试 。 


几 年 前 我 为 某 个 产品 审计 代码 ， 访 代码 开 友 了 已 经 超过 十 年 。 那 是 个 巨大 的 代码 库 ， 我 从 结构 中 可 以 分 辨 出 某 些 部 分 明显 比 
其 他 部 分 要 新 。 区 分 新 旧 代 码 的 一 个 线索 是 自动 化 测试 的 存在 。 但 我 很 快 友 现 ， 我 无 法 从 测试 的 名 字 来 分 辨 出 要 验证 的 内 容 ， 再 
仔细 看 ， 友 现 测试 根本 没有 在 验证 它 承 诺 的 内 容 。 它 不 是 Java 代 码 ， 但 我 把 它 翻 译 成 了 Java 的 例子 : 

public class TestBmap { 
QTest 
public void mask() { 
Bmap bmap = new Bmap() ; 
bmap.addParameter (IPSEC CERT NAME).， 
bmap.addParameter (IPSEC ACTION START DAYS, 0); 


bmap.addParameter (IPSEC_ACTION_START_ HOURS, 23); 
assertTrue (bmap.validate()).; 


} 


看 到 这 上段 代码 你 立刻 能 注意 到 测试 的 命名 不 够 理想 。 但 再 仔细 看 看 ， 无 论 “mask” 对 于 “Bmap” 意 味 着 什么 ， 测 试 也 仪 
仪 是 检查 了 某 些 参数 是 否 为 有 效 的 组 合 。 如 果 输 入 正确 的 情况 下 实际 行为 却 仍然 有 误 ， 那 么 参数 能 否 通 过 验证 也 就 变 得 无 关 紧 要 
To 

关于 测试 正确 的 事物 这 件 事 其 实 有 很 多 话 要 说 ,但 用 正确 的 方式 测试 正确 的 事物 也 很 关键 。 从 可 维护 性 角度 尤其 重要 的 是 ， 
你 的 测试 应 该 检查 预期 行为 而 非 具 体 实 现 。 下 一 章 会 涉及 这 个 话题 ， 现 在 先 按 下 不 表 。 


2.4 独立 的 测试 易于 单独 运行 
关于 测试 有 很 多 话 要 说 ， 哪 些 该 包含 ， 哪 些 不 该 包含 ， 哪 些 该 指定 ， 哪 些 不 该 指定 ， 如 何 从 可 读 性 角度 来 组 织 ， 等 等 。 对 测 
试 外 围 的 考虑 有 时 也 起 了 至 关 重 要 的 作用 。 


人 类 一 一 我 们 的 大 脑 过 于 精确 一 一 是 极其 强大 的 信息 处 理 器 。 我 们 几乎 可 以 瞬间 评估 身体 周围 的 环境 并 在 皮 有 眼 上 辣 做 出 反 
应 。 我 们 能 人 在 意识 到 要 球 飞 过 来 之 前 残 做 出 闪避。 这 些 反 应 根植 于 我 们 的 PDNA 中 。 





当 我 们 感知 到 相似 模式 时 ， 行 为 图 谱 束 会 指示 身体 移动 。 随 着 时 间 的 推移 ， 这 些 食谱 慢 慢 变 得 成 熟 ， 我 们 很 快 束 背 负 上 了 一 
个 互联 模式 和 行为 的 复杂 网 络 。 


这 种 情况 也 上 友 生 人 在 工作 中 。 昔 次 探索 别人 的 代码 库 时 ， 我 们 会 在 12 分 钟 内 形成 对 弟 见 惯例 、 模 式 、 代 码 坏 味道 和 陷阱 的 清 
晰 图 景 。 这 是 我 们 识别 相似 模式 的 能 力 在 起 作用 ， 并 且 能 够 告诉 我 们 可 能 还 会 在 附近 看 到 哪些 其 他 东西 。 


代码 坏 味 道 是 什么 ? 
代码 中 的 坏 味道 提示 我 们 代码 中 某 些 地 方 可 能 出 问题 了 。 引 用 Portland Pattern Repository 的 Wiki，“ 如 果菜 些 东 西 闻 起 来 发 自 
了 ， 那 绝对 需要 检查 它 一 下 ,但 是 不 见得 真 的 需要 修复 它 ， 或 者 只 能 继续 忍受 。 
例如 ， 当 我 接触 新 的 代码 库 时 ， 我 注意 到 的 第 一 件 事 情 瓯 是 方法 的 大 小 。 如 果 方 法 过 大 ， 我 立马 明日 在 那些 特定 模块 、 组 件 
或 源 文件 中 还 有 一 大 堆 问 题 等 着 我 吧 。 我 天 注 的 另 一 个 信号 是 变量 、 类 和 方法 名 字 的 摘 述 性 如 何 。 
具体 说 到 测试 代码 ， 我 天 注 测试 的 独立 水 平 ， 尤 其 是 架构 边界 附近 。 这 样 做 是 因为 我 在 边界 上 仔细 友 现 了 许多 代码 坏 味 道 ， 
于 是 我 学 会 了 一 看 到 外 部 依赖 时 残 特 别 小 心 ， 包 括 : 
”时间 
随机 数 
并 发 性 
` 基础 设施 
现存 数据 


“ 持久 化 


这 些 事物 的 共同 之 处 在 于 它们 往往 都 很 复杂 ， 对 于 一 个 项 目的 测试 基础 设施 (infrastructure) 来 说 ， 我 认为 最 基本 的 试 金 
石 (litmus test) 就 是 : 我 能 人 否 从 版 本 控制 中 签 出 全 新 的 代码 ， 复 制 到 由 | 内 导 开 包 凌 的 新 计算 机 上 ， 运 行 一 条 命令 ， 然 后 闭 起 二 
郎 腿 ， 看 着 整套 自动 化 测试 运行 并 且 通 过 ? 

隅 离 和 独立 很 重要 ， 因 为 没有 它们 就 难以 运行 和 维护 测试 。 开 发 者 为 了 运行 测试 而 不 得 不 对 系统 做 的 每 件 事 都 会 使 事情 变 得 

无 论 你 是 否 需要 在 文件 系统 中 特定 位 置 创 建 空 目录 ， 或 确保 你 具备 一 个 特定 版 本 的 MySQL 运 行 在 特定 端口 号 上 ， 或 添加 一 
条 用 于 测试 用 户 登 录 的 数据 库 用 户 记 录 ， 或 设 定 一 堆 环 境 变 量 -一 一 这 些 都 不 是 开发 者 该 做 的 。 这 些小 事 增 加 了 工作 量 并 会 累积 
为 奇怪 的 测试 失败 。[1 

例如 测试 执行 时 的 系统 时 钟 或 随机 数 生 成 器 的 下 一 个 值 ， 这 些 都 不 在 你 的 控制 之 中 ， 而 这 正 是 此 类 依赖 的 特征 。 作 为 经 验 法 
则 ， 你 想 要 避免 由 于 这 种 依赖 而 导致 测试 古怪 地 失败 。 你 希望 将 代码 放 进 一 个 台 钳 ， 通 过 传 入 测试 蔡 身 或 者 将 代码 与 环境 隅 离 ， 
使 其 行为 符合 你 的 需要 ， 从 而 控制 一 切 。 

在 测试 类 中 不 要 依赖 于 测试 的 顺序 

一 般 来 说 ， 不 让 测试 互相 依赖 是 指 你 不 该 让 一 个 类 中 的 测 会 依赖 舅 一 个 类 中 测试 的 执行 或 结果 。 但 这 也 同样 适用 于 同一 个 测 
试 类 中 的 依赖 。 

该 错误 的 典型 例子 是 这 样 的 ， 当 程序 员 在 (@BeforeClass 方 法 中 设置 系统 的 起 始 状 态 后 ， 写 下 了 三 个 连贯 的 (QWDTest 方 法 ， 每 个 
都 在 修改 系统 状态 ， 并 相信 上 一 个 测试 完成 了 一 部 分 工作 。 现 在 ， 当 第 一 个 测试 失败 时 ， 后 面 所 有 测试 都 会 失败 ， 但 那 还 不 是 最 


大 的 问题 





至 少 提示 你 发 现 了 错误 ， 对 吗 ? 


真正 的 问题 是 当 其 中 茶 些 测试 因为 错误 的 原因 而 失败 。 例如， 假设 测试 框架 决定 以 不 同 的 顺序 来 调用 测试 方法 。 虚 惊 一 场 。 


JVM 供 应 商 决 定 改变 反射 API 返 回 方法 的 顺序 。 一 场 虚 惊 。 测 试 框架 作者 决定 以 字母 顺序 来 运行 测试 。 又 是 虚惊 一 场 。 中 


你 不 喜欢 总 是 一 惊 一 乍 的 。 当 测试 要 检查 的 行为 正常 时 ， 你 并 不 希望 你 的 测试 失败 。 因 此 ， 你 不 该 故意 让 测试 执行 相互 依赖 
而 造成 它们 很 脆弱 。 


测试 意外 失败 的 最 不 寻常 的 例子 之 一 ， 是 一 个 测试 作为 套件 的 一 部 分 时 可 以 通过 ,但 单独 运行 却 神秘 地 失败 (反之 亦 然 ) 。 


那些 症状 散发 着 测试 相互 依赖 的 臭 气 。 它 们 假设 另 一 个 测试 在 目 己 之 前 运行 ， 而 且 那 个 测试 会 将 系统 置 于 某 个 特定 状态 。 当 
假设 不 成 立时 ， 你 丈 硬 着 头皮 去 调试 吧 ，。 


总 而 言 之 ， 当 编写 的 测试 涉及 时 间 、 随 机 数 、 并 上 友 性 、 基 础 设施 、 持 久 化 或 网 络 时 ， 你 融 应 该 格外 小 心 。 作 为 经 验 来 说 ， 你 
应 该 尽量 避免 依赖 它们 ， 将 它们 限制 到 小 的 隅 离 单元 中 ， 这 样 你 的 大 部 分 测试 融 不 会 遭受 并 上 友 证 ， 也 不 用 总 是 挨个 处 理 它 们 
只 有 少数 几 个 地 方才 用 得 着 操心 。 





那么 在 实践 中 看 起 来 如 何 呢 ? 你 到 底 访 做 什么 ? 例如 ， 你 可 以 看 看 你 能 否 找 到 一 个 方式 来 做 下 面 这 些 事 : 


用 测试 替身 替换 对 第 三 方 库 的 依赖 ， 根 据 需 要 将 其 包装 到 你 自己 的 适 配 层 中 。 将 各 种 麻烦 封装 进 适 配 层 以 后 ， 你 就 可 以 独 
立地 测试 其 余 的 程序 逻辑 。 


` 将 测试 代码 与 其 用 到 的 资源 放 在 一 起 ， 或 许 是 在 一 个 包 (package) 里 。 
` 让 测试 代码 上 自己 产生 所 需 资 源 ， 而 不 要 让 它们 与 源 代码 分 
令 测 试 自行 建立 所 需 的 上 下 文 。 不 要 依赖 于 之 前 运行 的 任何 测试 。 


` 对 于 需要 持久 化 的 集成 测试 ， 那 就 使 用 内 存 数 据 库 吧 ， 用 了 干净 的 数据 集 ， 就 能 极 大 地 简化 测试 的 启动 问题 。 还 有 ， 它 们 
通常 启动 得 超级 快 。 


将 线程 代码 分 为 同步 和 异步 两 部 分 ， 所 有 程序 逻辑 都 放 在 一 个 第 规 的 同步 代码 单元 中 ， 就 可 以 方便 地 进行 测试 并 且 没 有 并 
发 症 ， 将 环 手 的 并 发 部 分 留 给 一 小 堆 专用 测试 


当面 对 遗留 代码 时 要 做 到 测试 隔离 是 很 难 的 ， 那 些 代码 在 设计 时 并 未 考虑 可 测试 性 ， 因 此 不 具备 你 想 要 的 模块 化 。 但 即使 这 
样 ， 仍 然 值得 去 打破 那些 讨 大 的 依赖 从 而 使 你 的 测试 与 环境 隔离 并 相互 独立 。 你 的 测试 毕竟 得 靠得住 才 行 。 


[1 如果 你 无 法 避免 这 些 手 工 配 置 ， 那 么 至 少 确保 开发 者 只 需要 做 一 次 。 
[2] 如 果 这 听 起 来 有 点 不 可 思议 ， 你 应 该 知道 JUnit 并 不 保证 按照 特定 顺序 运行 测试 方法 。 事 实 上 ， 当 Java 7 政变 了 
Class#getDeclaredMethods( 返回 的 方法 声明 顺序 ，NetBeans 项 目 中 的 几 个 测试 就 失败 了 。 哦 ， 我 猜 它 们 的 测试 不 够 独立 …… 


2.5 ”可 徘 的 测试 才 是 可 徘 的 


前 一 节 中 我 说 过 ， 有 时 候 测 试 的 内 容 与 你 想象 的 完全 不 同 。 更 让 人 操心 的 是 ， 有 了 时 它们 根本 什么 都 没 测试 。 





我 的 一 个 同事 习惯 于 称 这 种 测试 为 快乐 的 测 语 ， 指 菏 个 测试 快乐 了 路 径 一 一 却 没 
有 一 名 断言。 是 的 ， 你 的 测试 履 兰 率 报告 看 起 来 很 棒 ， 因 为 测试 全 面 地 执行 了 你 写 的 每 句 话 。 问 题 是 这 种 测试 只 有 在 生产 代码 抛 


异 单 时 才 会 失败 。 


你 无 法 依靠 这 种 测试 来 保护 自己 ， 对 吗 ? 特别 是 如 果 程 序 员 惯 于 将 所 有 测试 方法 体 封装 到 try-catch 块 中 的 时 候 。( 代码 清 
单 2.2 展 示 了 这 种 坏 习惯 。 


代码 清单 2.2 ”你 能 指出 这 个 测试 的 缺陷 吗 ? 


@Test 

public void shouldRefuseNegativeEntries() { 
nt total = Tecorgd, totalli:; 
xy 1 


record.add(-1);， 
} catch (IllegalArgumentException expected) { 
dsertEouals(total, Teoorg. EoOtal(}}s 


} 


某 些 测试 相对 来 说 不 太 容 易 失 败 ， 代 码 清单 2.2 是 一 个 典型 的 极端 例子 ， 其 中 的 测试 或 许 永 远 不 会 失败 (过 去 也 没有 过 ) 。 
如 果 你 仔细 观察 ， 你 会 注意 到 即使 add (-1) 没有 如 期 地 抛 出 异常 ， 测 试 也 不 会 失败 。 


几乎 不 会 失败 的 测试 就 等 于 废物 。 也 就 是 说 ， 间 欣 性 地 通过 或 失败 的 测试 就 是 在 公然 地 侵害 程序 员 小 伙伴 们 ， 见 图 2.3。 


人 从 值 递 减 加 入 吕 声 


永 不 失败 : 总 是 失败 
的 测试 的 测试 
“快乐 ”的 测试 随机 的 测试 





哪里 站 最 佳 平 衡 氮 ” 





图 2.3 如果 测试 从 不 失败 或 一 直 失 败 ， 那 它们 就 没 价值 


几 年 前 ， 我 为 某 个 项 目 做 容 询 ， 化 了 大 部 分 时 间 与 客户 的 技术 人 员 及 其 他 顾问 做 结对 编程 。 一 天 早上 我 和 我 的 搭档 接 到 一 个 
新 任务 ， 然 后 像 往 单一 样 先 运行 一 下 相关 的 测试 集 。 我 的 搭档 对 代码 库 相 当 熟 悉 ， 编 写 了 其 中 大 部 分 代码 ， 也 熟悉 其 中 的 各 种 怪 
异 之 处 。 在 我 们 做 出 任何 修改 之 前 ,我 注意 到 一 些 测试 在 第 一 次 运行 时 失败 了 。 让 我 惊讶 的 是 ， 我 的 搭档 如 此 来 对 待 失败 的 测试 
一 一 他 不 断 地 一 遍 遍 重复 运行 测试 ， 直 到 四 五 次 以 后 所 有 测试 至 少 都 通过 了 一 次 。 我 不 是 100% 确 定 ， 但 我 不 认为 所 有 测试 都 是 
在 同一 次 运行 中 通过 的 。 


我 目瞪口呆 ， 我 意识 到 我 见 到 的 一 堆 测 试 其 实 全 都 是 不 可 靠 的 测试 。 某 些 测 试 会 随机 地 失败 ， 因 为 被 测 代码 包含 了 不 确定 的 
逻辑 ， 于 是 测试 有 50% 的 机 会 会 失败 。 除 了 在 被 测 代码 中 使 用 了 伪 随 机 数 生 成 器 之 外 ， 这 种 间 拘 性 行为 的 另 一 个 常见 原因 是 使 用 
了 时 间 相 关 的 APl。 我 最 喜欢 调用 System.currentTimeMillis()， 紧 随 其 后 的 就 是 在 测试 异步 逻辑 时 无 处 不 在 的 
Thread.sleep (1000) 。 


为 了 让 测试 值得 依靠 ， 它 们 残 需要 可 重复 。 如 果 运 行 两 般 测 试 ， 它 残 必须 给 我 相同 的 结果 。 人 否则 ， 我 残 不 得 不 企 每 次 构建 之 
后 及 取 人 工 干预 ， 因 为 无 法 知道 1250/2492 是 意味 着 一 切 正常 ， 还 是 说 最 后 一 遍 时 全 都 挂 了 。 无 法 知道 。 


如 果 你 的 逻辑 包含 异步 内 容 或 依赖 于 当前 时 间 ， 确 保 将 它们 隔离 在 一 个 接口 之 后 ， 这 样 你 可 以 用 “测试 替身 ”来 蔡 换 它们 从 
而 使 测试 可 重复 一 一 这 是 测试 变 得 可 靠 的 一 个 关键 要 素 。 


[1 真实 的 故事 。 我 花 了 1 个 小 时 来 去 掉 它 们 ， 然 后 当天 剩 下 的 时 间 里 都 在 修复 或 删除 这 些 我 发 据 出 的 失败 测试 。 


2.6 ”每 个 行业 都 有 其 工具 而 测试 也 不 例外 


我 说 的 测试 替身 是 什么 ?如 果 你 的 程序 员工 具 箱 中 没有 测试 蔡 身 ， 你 束 错 过 了 测试 的 许多 功能 。 测 试 蔡 刁 是 程序 员 熟 知 
的 stub ( 桩 ) 、fake (伪造 对 象 ) 、mock (模拟 对 和 象 ) 的 忌 称 。 它 们 本 质 上 是 为 了 测试 目的 、 用 于 奉 换 真实 协作 者 的 对 象 ， 如 


图 2.4 所 示 。 


A 


Campbell Duck Crested Duck Test Double Duck 


图 2.4 ”鸭子 的 测试 替身 ， 看 起 来 像 鸭 子 ， 叫 起 来 几乎 也 像 只 了 鸭子 





但 当然 不 是 真 鸭子 

你 可 以 说 测试 蔡 身 是 测试 感染 的 程序 员 的 最 佳 伙伴 。 因 为 它们 促进 了 许多 改进 并 为 我 们 提供 许多 新 工具 ， 如 |: 

- 通过 简化 要 执行 的 代码 来 加 速 执行 测试 

` 模拟 难以 出 现 的 异常 情况 

观察 那些 对 测试 代码 不 可 见 的 状态 和 交互 

关于 测试 蔡 身 还 有 很 多 要 说 的 ， 下 一 章 将 详细 讨论 这 一 话题 。 但 测试 蔡 身 并 不 是 行业 中 编写 自动 化 测试 的 仅 有 工具 。 


行业 中 最 基本 的 工具 或 许 丈 是 测试 框架 了 ， 比 如 JUnit。 我 仍然 记得 最 初 如 愿 以 偿 地 让 代码 工作 起 来 的 上 时光。 每 当 程 序 出 错 
卡 住 了 ， 我 丈 会 取消 好 几 条 语句 用 于 向 控制 台 输 出 ， 然 后 重启 程序， 这 样 我 束 能 通过 分 析 控 制 台 输 出 来 找 出 失败 的 位 置 和 原因 。 


职业 生涯 最 初 几 个 月 ， 我 见 到 商用 软件 开发 者 也 在 用 同样 的 方式 工作 。 与 利用 JUnit 之 类 的 工具 编写 自动 化 、 可 重复 的 测试 
相 比 ， 我 相信 我 不 用 指出 那样 做 有 多 浪费 和 多 不 专业 。 





除了 合适 的 测试 框 染 和 测试 蔡 身 之 外 ， 在 编写 自动 化 测试 的 前 三 样 工具 中 还 包括 另 一 种 一 一 构建 工具 。 无 论 你 的 构建 过 程 


是 怎样 的 ， 构 建 脚 本 中 用 到 哪 种 工具 或 技术 ， 都 没 理 由 不 将 目 动 化 测试 集成 到 构建 中 。 


2.7 小结 


本 章 为 优秀 测试 粗略 地 定义 了 几 个 特征 。 


我 们 措 出 ， 这 些 特征 都 是 依赖 于 上 下 文 的 ， 没 有 绝对 的 真理 能 使 得 测试 变 得 “优秀 ”。 目 动 化 测试 有 多 优秀 取决 于 它 有 多 符 
合 目标 ， 对 此 我 们 识别 出 一 些 具 有 重大 影响 的 普 思 问题 。 


我 们 首先 指出 测试 的 一 个 主要 优点 是 可 读 性 ， 因 为 如 果 难 以 阅读 和 理解 ， 测 试 束 会 这 来 维护 问题 ， 其 实 要 解决 这 个 问题 也 很 


快 一 一 删 挥 尼 ， 因 为 维护 起 来 成 本 太 局 。 


接 下 来 我 们 指出 ,测试 代码 的 结构 有 助 于 使 之 更 好 用 ， 人 允许 程序 员 快 速 定位 到 正确 的 位 置 ， 有 助 于 程序 员 理 解 友 生 了 什么 
与 可 恋 性 一 脉 相 承 。 





接 下 来 我 们 曾 明 ,测试 有 时 候 是 在 测试 错误 的 事物 ， 它 将 你 市 入 卜 途 或 尝 水 之 中 而 造成 问题 ， 这 样 反 而 隐藏 了 测试 的 真实 多 
辑 ， 使 测试 难以 阅读 。 


天 于 测试 有 时 候 不 可 靠 的 话题 ， 我 们 还 为 此 识别 了 一 些 单 见 原因 ， 以 及 可 重复 测试 的 重要 性 。 


最 后 ， 我 们 认为 在 行业 中 编写 自动 化 测试 的 三 个 基本 工具 是 一 一 用 于 编写 测试 的 测试 框架 、 用 来 运行 测试 的 目 动 化 构建 和 
改善 测试 及 可 测试 性 的 测试 替身 。 第 三 个 话题 如 此 重要 ， 以 至 于 我 们 将 在 下 一 草 专 门 讨论 如 何 使 用 测试 替身 来 编写 优秀 的 测试 。 


第 3 齐 ” 测 也 茶 身 


本 章 内 容 包括 : 

. 我们 能 用 测试 替身 做 些 什么 
:哪些 测试 替身 可 供 选 择 

: 使 用 测试 替身 的 指南 


自从 我 们 开始 用 类 和 方法 来 构建 软件 时 ， 桩 (stub) 或 哑 元 (dummy) 的 概念 也 差不多 存在 了 。 过 去 这 类 工具 主要 用 于 占 
位 ， 直 到 真正 的 事物 准备 好 一 一 它 允许 你 在 周边 代码 束 位 之 前 就 能 编译 和 执行 某 段 代码 。 


在 现代 开 友 者 测试 的 上 下 文中 ， 这 些 对 象 具有 了 更 多 的 不同 目的 。 除 了 允许 在 某 些 依赖 缺失 的 情况 下 编译 执行 代码 之 外 ， 崇 
尚 测试 的 程序 员 还 创建 了 一 系列 “ 仅 供 测试 ”的 工具 ， 用 于 隔离 被 测 代码 、 加 速 执行 测试 、 使 随机 行为 变 得 确定 、 模 拟 特 殊 情 
况 ， 以 及 使 测试 能 够 访问 隐藏 信息 。 


满足 这 些 目的 的 各 种 对 象 具有 相似 之 处 ， 但 又 有 所 区 别 ， 我 们 统称 为 测试 蔡 身 (test double) 。[1 


我 们 移 探 讨 开 上 友 痢 有 米 用 测试 著 身 的 理由 。 理 解 了 使 用 测试 蔡 身 的 潜在 好 处 后 ， 我 们 看 看 各 种 可 供 选 择 的 类 型 。 最 后 ， 我 们 以 
几 个 使 用 测试 蔡 身 的 简单 指南 来 结束 本 草 。 


但 是 现在 ， 我 们 问 问 目 己 ， 它 对 我 意味 着 什么 ? 


[1] 尽管 测试 替身 术语 最 初 是 由 Manning 的 作家 同行 J/. B. Rainsbetget 介绍 给 我 的 。 但 我 相信 是 Gerard Meszatos 和 他 的 《xUnit Test 


Pattetns : Refactoting Test Code》 一 书 (Addison Wesley，2007) 将 此 术语 及 相关 分 类 在 软件 社区 发 扬 光 大 。 


3.1 测试 茶 身 的 威力 


甘地 (Mahatma Gandhi) 说 过 : “改变 世界 从 自身 做 起 ”。 (Be the change you want to see in the world.) 测试 蔡 
身 啊 应 了 甘地 的 召唤 ， 成 为 你 在 代码 中 和 希望 见 到 的 变化 。 牵 强 附 会 》 容 我 慢 慢 道 来 。 


代码 是 一 个 大 集合 。 它 是 指 代 其 他 代码 的 代码 网 络 。 每 一 块 都 有 预定 义 的 行为 一 一 作为 程序 员 的 你 定义 了 那些 行为 。 某 些 
行为 是 原子 的 ， 包 含 在 单个 类 或 万 法 中 。 某 些 行为 意味 着 不 同 代码 块 之 间 的 交互 。 


为 了 时 不 时 地 验证 一 段 代码 的 行为 符合 你 的 期 望 ， 最 好 的 选择 是 蔡 换 其 周围 的 代码 ， 使 你 获得 对 环境 的 完整 控制 ， 从 而 在 其 
中 测试 你 的 代码 。 你 有 效 地 将 被 测 代码 与 其 协作 者 隔离 开 ， 以 便 进 行 测 试 ， 如 图 3.1 所 示 。 
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图 3.1 测试 替身 帮助 你 隔离 被 测 代码 ， 这 样 你 就 能 测试 其 行为 的 各 个 方面 。 本 例 中 ， 我 们 用 测试 替身 替换 掉 了 四 个 协作 者 中 的 
三 个 ， 将 测试 范围 确定 为 被 测 代码 本 身 的 行为 和 协作 ， 人 外 加 一 个 特定 的 协作 者 






这 是 引入 测试 蔡 身 的 最 根本 原因 一 一 将 被 测 代 码 与 周围 隔离 开 。 此 外 ， 如 本 章 开头 所 述 ， 还 存在 许多 其 他 原因 。 我 们 认 
为 “ 仪 供 测试 ”的 工具 是 为 了 : 


隔离 被 测 代码 

:加速 执行 测试 

` 使 执行 变 得 确定 

` 模拟 特殊 情况 

:访问 隐藏 信息 

存在 多 种 类 型 的 测试 蔡 身 可 供 实现 这 些 效 果 。 多 数 效 果 可 以 用 一 种 测试 替身 实现 ， 而 有 些 则 只 匹配 于 某 种 特定 类 型 。3.2 市 
会 再 次 讨论 这 些 问题 。 现 在 ， 我 根 对 列 出 的 理由 建立 共识 一 一 在 第 一 时 间 获 得 测试 替身 的 理由 ， 以 及 使 用 它们 的 目的 。 
3.1.1 ” 隅 敲 被 测 代码 

过 论 在 面 癌 对 象 编 程 语言 的 上 下 文中 隔离 极 测 代码 时 ， 我 们 的 世界 包含 两 种 乐 西 : 

. 被 测 代码 


` 与 被 测 代 码 交 互 的 代码 


当 我 们 说 要 “隔离 被 测 代码 ”时 ， 意 味 着 将 需要 测试 的 代码 与 所 有 其 他 代码 隅 离开 来 。 如 此 一 来 ， 我 们 不 仅 使 测试 更 加 有 针 
对 性 和 容易 理解 ， 还 更 容易 建立 测试 。 实 际 上 ，“ 所 有 其 他 代码 ”包括 了 从 被 测 代 码 中 调用 的 代码 。 代 码 清单 3.1 通 过 一 个 简单 


的 例子 来 展示 。 


代码 清单 3.1 被 测 代码 (Car) 及 其 协作 者 (Engine 和 Route) 


Dupe Class Car 区 
private Engine engine; 


public Car(Engine engine) { 
this.engine = engine; 


} 


Due von SEE 4 
engine.start(); 


} 


public void drive(Route route) { 
for (Directions directions : route.directions()) { 


directions.follow(): 


} 
} 


DLLae VOLG BO 4 
engine.stop () ; 


} 


如 你 所 见 ， 这 个 例子 包含 了 汽车 (Car) 、 汽 车 引擎 (Engine) 和 由 一 系列 方向 (Directions) 组 成 的 路 径 (Route) 。 假 
设 现在 你 想 要 测试 汽车 。 我 们 总 共有 四 个 类 ， 其 中 一 个 是 和 被 测 代 码 (Car) ， 两 个 是 协作 者 (Engine 和 Route) 。 为 什么 
Directions 不 是 协作 者 ? 某 种 意义 上 ，Car 引 | 用 和 调用 了 Directions 上 的 方法 。 但 是 还 有 另 一 个 角度 去 观察 这 个 场景 。 我 们 看 看 


图 3.2 能 否 帮 助 淤 清 这 个 观点 。 
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图 3.2 ”Car 直接 使 用 了 Engine 和 Route， 而 只 是 间接 地 使 用 了 Directions 


如 果 我 们 从 Car 的 方法 中 引用 的 类 来 关注 高 一 级 的 抽象 层次 ， 并 站 在 Car 的 角度 ， 我 们 看 到 的 会 是 Car 通 过 Route 来 获取 和 访 
问 Directions (如 图 3.2) 。 因 此 ， 用 测试 蔡 身 替换 Engine 和 Route， 即 可 将 Car 与 其 所 有 的 协作 者 都 隔离 开 。 由 于 我 们 用 伪 实 现 
蔡 损 了 Route， 因 此 完全 控制 了 向 Car 提 供 的 各 种 Directions。 


既然 你 明日 了 基本 原则 ， 即 如 何 通 过 一 些 测试 替身 进行 蔡 换 从 而 获得 控制 ， 我 们 再 来 看 看 用 它们 还 能 做 哪些 好 玩 儿 的 事情 。 


3.1.2 ”加 速 执行 测试 


蔡 换 挥 真 实 协作 者 会 市 来 一 个 愉悦 的 副作用 ， 那 束 是 测试 蔡 身 的 实现 经 常 比 真实 事物 执行 得 要 快 。 有 了 时， 测试 蔡 身 的 速度 不 
只 是 副作用 ， 而 是 使 用 测试 车身 的 主要 原因 。 


考虑 图 3.2 中 的 驾驶 例子 。 假 设 初 始 化 Route 要 涉及 加 权 图 搜索 算法 ， 以 便 找 出 汽车 (Car) 当前 位 置 与 目的 地 之 间 的 最 短路 
径 。 由 于 今日 街道 和 高 速 公路 网 络 的 复杂 性 ， 计 算 需 要 花 一 点 时 间 。 尽 管 折腾 一 次 算法 可 能 还 比较 快 ， 但 即使 小 小 的 延迟 也 会 积 
少 成 多 。 如 果 每 个 测试 都 初始 化 一 次 Route， 你 可 能 会 在 这 个 算法 上 消耗 好 几 秒 甚至 几 分 钟 的 CPU 周 期 一 一 当 开 发 者 运行 自动 化 
测试 来 获得 快速 反馈 时 ， 几 分 钟 丈 等 于 永远 。 


放置 一 个 测试 替身 ， 令 它 思 是 返回 预先 计算 好 的 通 往 终点 的 路 径 ， 这 样 蕊 会 避免 不 必要 的 等 待 ， 而 且 测 试 运行 得 更 快 了 。 太 
棒 了 。 但 有 些 地 方 还 是 需要 那些 缓慢 的 Route 算法 一 任 单 独 有 针对 性 的 测试 中 一 一 但 你 不 希望 到 处 都 运行 缓慢 的 算法 。 





尽管 速度 忆 是 一 件 好 事 ， 但 它 不 忌 是 最 重要 的 事情 。 毕 葛 ， 如 果 方 向 开 错 了 ， 青 快 的 车 也 没 用 。 
3.1.3 ”使 执行 变 得 确定 


我 曾 听 过 著名 励志 演讲 家 Tony Robbins 讲 到 过 惊喜 ， 尽 管 我 们 都 说 自己 喜欢 惊喜 ， 但 我 们 只 喜欢 那些 自己 想 要 的 惊喜 。 没 
首 ， 对 于 软件 也 一 样 ， 特 别 是 当 谈 到 测试 代码 时 。 

测试 残 是 指定 行为 ， 并 验证 行为 符合 规 溯 。 只 要 代码 具有 完全 确定 性 ， 并 且 其 逻辑 不 包含 一 丝 随 机 性 ， 这 残 是 简单 而 直接 
的 。 其 实 ， 为 了 使 代码 (和 测试 ) 具有 确定 性 ， 你 残 需要 能 够 针对 同样 的 代码 重复 地 运行 测试 ， 并 总 是 得 到 相同 的 结 


很 多 时 候 ， 你 的 生产 代码 需要 包含 随机 性 因素 ， 或 者 其 他 因素 造成 重复 执行 的 结果 不 唯一 。 例 如 ， 如 果 你 开发 一 个 掷 蜗 子 的 
Craps 游 戏 ， 你 最 好 让 咒 子 的 结果 不 能 预测 一 一 这 就 是 随机 。 门 ] 





或 许 不 确定 行为 的 最 典型 情形 就 是 依赖 于 时 间 的 行为 。 回 到 Car 的 例子 ， 它 向 Route 请 求 Directions， 想 象 一 下 用 来 计算 路 
径 的 算法 会 涉及 时 间 ， 以 及 流量 、 限 速 等 ， 如 代码 清单 3.2 所 示 。 


代码 清单 3.2 ”有 了 时候， 代码 行为 天 生 残 是 不 确定 的 


public class Route { 
private Clock clock = new Clock(); 


private ShortestPath algorithm = new ShortestPath ( ) ; 在 高 峰 时 间 讨 
public Collection<Directions> directions() { | 和 
if (Clock.isRushHour ()) { 不 相同 ! 

return algorithm.avoidBusyIntersections ( ) ; 
} 
return algorithm.calculateRouteBetween(...); 


这 样 的 话 ， 如 果 在 不 同时 间 执 行 测试 ， 你 如 何 确保 路 径 算法 的 正确 性 ”毕竟 ， 算 法 肯定 是 从 某 个 时 钟 获取 了 时 间 ， 尽 管 企 下 
午 3: 40 或 3: 50 时 算法 可 能 建议 走高 速 公 路 ， 但 如 果 现 在 是 下 午 3: 50， 那 么 最 佳 结果 可 能 突然 融 变 成 了 走 洲际 公路 ， 因 为 高 
速 公 路 的 晚 高 峰 开始 了 。 


测试 著 身 也 可 以 对 这 类 不 确定 行为 伸 出 援手 。 例 如 ， 当 你 的 仍 子 变 成 可 以 作弊 的 测试 蔡 身 ， 并 能 产 出 一 串 已 知 的 点 数 序列 
时 ，Craps 游 戏 的 特定 实例 突然 束 变 得 容易 模拟 了 。 相 类 似 ， 如 果 你 用 一 个 固定 时 刻 的 测试 替身 来 替换 挥 系统 时 钟 ， 你 束 更 容易 


去 摘 述 某 个 日 志文 件 的 预期 输出 。 


控制 你 的 协作 者 ， 并 在 精确 设置 被 测 场 景 时 能 够 消除 所 有 变量 ， 这 是 使 执行 变 得 确定 的 关键 。 说 到 场景 ,测试 蔡 身 也 能 模拟 
正常 情况 下 不 会 友 生 的 情况 。 


3.1.4 ”模拟 特殊 情 ) 





我 们 编写 的 大 多 数 软件 往往 是 简单 粗暴 的 一 一 全 少 在 某 种 意义 上 ， 大 多 数 代码 都 是 确定 的 。 因 此 ， 通 过 实例 化 合适 的 对 象 
(object graph) ， 并 将 其 作为 参数 传 入 被 测 代 码 ， 我 们 可 以 重建 几乎 任何 的 情况 。 当 我 们 从 “1 Infinite 
Loop，Cupertino，CA” 出 发 ,设置 “1600 Amphitheatre Parkway，Mountain View，CA” 为 终点 ， 然 后 说 drive() ( 开 
车 ) ， 那 么 我 们 可 以 测试 代码 清单 3.1 中 Car 最 终 应 该 停 在 正确 的 地 方 。 


我 们 无 法 仅 用 API 和 产品 代码 的 特性 来 创建 某 些 情 况 。 假 设 我 们 的 Route 通过 互联 网 从 Google 地 图 来 获取 路 线 方向 。 若 是 请 
求 方向 时 互联 网 连接 不 幸 中 断 ， 这 种 情况 下 该 如 何 测试 Route 的 表现 依然 正常 ? 

通过 禁用 计算 机 的 网 络 接口 进行 测试 ， 其 缺点 在 于 你 无 法 伪造 这 类 网 络 连 接 错 误 ， 但 是 若 将 某 处 蔡 换 为 测试 蔡 身 的 话 ， 则 可 
以 在 请 求 连接 时 抛 出 一 个 异常 。“ 


3.1.5 ”暴露 隐藏 的 信息 


采用 测试 替身 的 最 后 一 个 〈 也 很 重要 的 ) 理由 ， 是 令 我 们 的 测试 访问 到 无 法 访问 的 信息 。 特 别 是 在 Java 上 下 文中 ， “暴露 信 
息 ” 首 先 起 到 的 是 允许 测试 能 够 读 写 其 他 对 象 的 私有 成 员 。 尽 管 有 时 你 决定 去 那样 做 DB， 但 这 里 的 信息 指 的 却 是 被 测 代码 与 其 协 
作者 之 间 的 交互 。 

我 们 再 用 可 靠 的 Car 例 子 来 帮助 你 掌握 这 种 动态 。 这 是 从 代码 清单 3.1 中 复制 的 Car 类 中 的 代码 片段 


public class Car { 
private Engine engine; 


HLLLe WOLd. Start ly 4 
engine.start().; 


} 


// rest omitted for clarity 


} 


如 你 所 见 ， 当 某 人 启动 汽车 Car 的 时 候 ,汽车 Car 局 动 它 的 引擎 Engine。 你 如 何 测试 它 真 的 发 生 了 ? 你 可 以 向 测试 代码 暴露 
私有 成 员 ， 并 为 Engine 增 加 一 个 新 方法 用 于 判定 引擎 是 否 局 动 了 。 但 是 如 果 你 不 想 那 么 做 的 话 呢 ?要 是 你 不 想 仅 仅 为 了 测试 而 
弄 乱 生产 代码 呢 ? 


现在 你 大 概 猜 到 了 ， 答 案 就 是 测试 替身 。 通 过 将 Car 的 Engine 蔡 换 为 测试 替身 ， 可 以 向 测试 代码 中 添加 仅 供 测试 的 方法 ， 避 
免 增 加 一 个 永远 不 会 在 生产 环境 中 使 用 的 isRunning( 方 法 而 弄 乱 你 的 生产 代码 。 测 试 代码 如 代码 清单 3.3 所 示 。 


代码 清单 3.3 ”测试 蔡 身 可 以 提供 内 大 消息 


public class CarTest { 


GTest 
public void engineIsStartedWhenCarStarts() { 测试 替身 来 帮忙 
TestEngine engine = new TestEngine(); 


new Car (engine) .start(); 


assertTrue (engine.isRunning ()); 方法 仅 存 在 于 
} TestEngine, 
} 而 非 Engine 


public class TestEngine extends Engine { 
private boolean isRunning; 


DUbDLEG Tong SEarel) 
ilsRunning = true; 


} 


public boolean isRunNnning() { 
return isRunning; 


} 


如 你 所 见 ， 我 们 的 示例 测试 用 测试 替身 @ 来 配置 Car， 多 启动 汽车 ， 使 用 测试 替身 来 验证 引擎 如 愿 启动 @。 强 调 一 
下 ，isRunning( 不 是 Engine 的 方法 





它 是 我 们 添加 到 TestEngine 上 的 ， 用 于 揭示 正常 Engine 所 不 能 暴露 的 信息 。? 
现在 你 理解 了 使 用 测试 替身 的 最 常见 原因 。 现 在 该 看 看 不 同类 型 的 测试 蔡 身 了 ， 以 及 它们 各 目 所 具有 的 优势 。 


[1] Craps 是 一 个 毛 贷 子 游戏 ， 玩 家 对 两 只 磺 子 的 结果 下 注 。 这 就 是 电影 中 黑帮 玩 的 游戏 ， 他 们 蹄 在 街角 ， 守 着 一 堆 钞 票 在 毛 山 
J 

[2] 虽然 编 个 程序 让 乐高 智力 风暴 (Lego Mindstorms) 机 器 人 去 氢 掉 你 的 网 线 肯 定 是 件 非 常 棒 的 事情 。 

[3] 通常 来 说 ， 从 外 部 来 探测 对 象 的 内 部 并 不 是 一 个 好 主意 。 每 当 我 觉得 需要 做 类 似 的 事情 时 ， 都 表明 我 的 设计 中 隐藏 了 某 个 缺 
失 的 抽象 。 

[4] 这 种 通过 构造 函数 传递 依赖 的 风格 称 为 构造 函数 注入 。 


[5] 说 到 测试 替身 扩展 真实 对 象 的 接口 ， 没 有 理由 说 你 不 能 在 TestEngine 上 增加 一 个 类 似 assertIsRunning0 的 方法 ! 


3.2 ”测试 茶 身 的 类 型 


你 见 过 了 使 用 测试 蔡 身 的 各 种 原因 ， 我 们 也 暗示 了 有 多 种 测试 蔡 身 可 供 选 择 。 我 们 来 仔细 看 看 那些 类 型 吧 。 图 3.3 展 示 了 这 
把 大 全 下 的 四 种 对 象 。 


测试 蕉 里 


测 研 桩 伪 千 对象 测 研 则 诬 模拟 对 象 





图 3.3 ”测试 替身 这 把 大 伞 之 下 聚集 了 四 种 对 象 


既然 我 们 已 经 制定 了 测试 替身 的 分 类 ， 现 在 就 来 认识 一 下 它们 ， 并 了 解 相互 的 区 别 ， 以 及 运用 它们 的 典型 目的 。 我 们 先 从 最 
税 早 的 开始 。 


3.2.1 ”测试 桂 通 弟 是 短小 的 


我 这 样 来 定义 它 : 桩 (名词) ， 截 断 的 或 非 弟 短 的 物体 。 


这 行 生 出 测试 桩 的 精确 定义 。 测 试 桩 (简称 桩 或 Stub) 的 目的 是 用 最 简单 的 可 能 实现 来 代 蔡 真实 实现 。 最 基本 的 实现 例子 
就 是 一 个 对 象 的 所 有 方法 都 只 有 一 行 ， 且 它们 各 自 返 回 一 个 适当 的 默认 值 。 


假如 你 负责 的 代码 应 当 对 自己 的 操作 生成 一 段 审计 日 志 ， 并 通过 叫做 Logger 的 接口 写 入 远程 日 志 服 务 器 。 假 如 Logger 接 口 
仅仅 定义 了 一 个 方法 来 产生 此 类 日 志 ， 那 么 Logger 接 口 的 桩 看 起 来 是 这 样 : 


public class LoggerStub implements Logger { 
public void log(LogLevel level, String message) { } 
} 


有 没有 注意 到 log0 方 法 其 实 什么 都 没 做 ? 这 是 桩 的 典型 例子 一 一 什么 都 不 做 。 毕 竟 ， 你 正 是 对 真实 Logger 实 现 打 桩 ， 因 为 
你 在 测试 时 完全 不 在 乎 日 志 ， 那 么 又 何必 真 写 日 志 呢 ? 但 是 有 时 候 什么 都 不 做 也 不 行 。 例 如 ， 如 果 Logger 接 口 还 定义 了 一 个 方 
法 来 确定 当前 设置 的 日 志 级 别 (Log Level) ， 那 么 桩 实现 看 起 来 可 能 是 这 样 : 


public class LoggerStub implements Logger { 
public void log(LogLevel level, String message) { 
// Still a no-op 
} 


public LogLevel getLogLevel() { 
return LogLevel .WARN; // hard-coded return value 
} 
} 


我 们 在 这 个 类 中 硬 编码 了 getLogLevel( 方 法 ， 它 总 是 返回 LogLevel.WARN。 有 没有 搞 错 ? 大 部 分 情况 下 这 绝对 没 问题 。 毕 
， 我 们 有 三 个 充分 的 理由 来 使 用 测试 桩 代 著 真实 Logger 实 现 : 


器 


1. 我 们 的 测试 不 关心 被 测 代 码 所 写 的 日 志 。 

2. 我 们 没有 运行 日 志 服 务 器 ， 所 以 测试 会 悲剧 地 失败 。 

3. 我 们 也 不 希望 测试 套件 在 控制 台中 输出 大 量 字 证 (更 别提 将 所 有 数据 写 入 文件 了 ) 。 

税 而 言 之 ，Logger 桩 实现 完美 地 满足 了 我 们 的 需要 。 

有 时 候 ， 简 单 的 硬 编码 返回 语句 和 一 堆 空 的 void 方法 还 不 够 。 有 时 候 你 至 少 需要 填充 一 些 行 为 ， 而 有 时 候 你 需要 测试 蔡 身 根 
据 收 到 的 消息 种 类 来 表现 出 不 同 的 行为 。 这 些 情况 下 ， 你 会 借助 伪造 对 象 。 


3.2.2 ”伪造 对 象 做 事 不 产生 副作用 


比 起 stub， 伪 造 对 象 (简称 Fake) 是 一 种 更 加 复杂 的 测试 蔡 身 。Stub 可 以 返回 硬 编码 值 ， 而 每 个 测试 可 能 需要 有 产 异 地 实 
例 化 来 返回 不 同 值 ， 以 模拟 不 同 的 场景 。Fake 更 像 是 真实 事物 的 简单 版 本 ， 优 化 地 伪造 真实 事物 的 行为 ， 但 是 没有 副作用 或 使 


用 真实 事物 的 其 他 后 果 。 


持久 化 对 稼 是 采用 Fake 的 典型 例子 。 假 设 应 用 程序 以 构 是 这 样 的 : 一 些 存储 对 每 提供 持久 化 服务 ， 它 们 知道 如 何 存 储 和 查 
找 指定 的 对 象 类 型 。 这 种 存储 对 象 可 能 提供 的 API 如 下 : 


public interface UserRepository { 
VOld save(User user); 
User findById(long id): 
User findByUsername (String username).,， 


对 于 使 用 存储 对 象 的 应 用 程序 ， 如 果 没 有 这 种 测试 蔡 身 ， 测 试 全 都 将 试图 访问 真实 的 数据 库 。 要 是 对 UserRepository 接 口 
打桩 ， 令 其 精确 地 返回 测试 所 需 ， 你 就 会 感觉 好 一 些 。 但 是 模拟 更 复杂 的 场景 肯定 会 越发 复杂 。 另 一 方面 ， 由 于 
UserRepository 接 口 足 够 简单 ， 以 至 于 你 可 以 实现 一 个 思春 而 简单 的 内 仓 数 据 库 ， 它 只 提供 基本 的 数据 类 型 。 代 码 清单 3.4 提 供 
了 一 个 例子 。 


代码 清单 3.4 ”实现 伪造 对 象 不 见得 那么 困难 


public class FakeUserRepository implements UserRepository 1 
Drivate Collection<User> users = new ArrayList<User>():; 


Public void save(User user) 1 
if (findBvyvId (user.getId()}) == mul1) 1{ 


users.add (user). 


lL 


PUublic User findById(long 1d) { 
for (User user : users) { 
if (user.getId() == id) return user:; 
J} 


return null: 


} 


public User findByUsername (String username) 《 
for (User user : Users) ({ 
lt (user.getUsername() .equals (username)) ({ 
return user; 
} 
】 


return null: 


用 这 种 另类 实现 来 蔡 换 真实 事物 的 优点 在 于 ， 它 像 只 鸭子 那样 嘎 嘱 叫 ， 还 能 摇摆 ， 但 它 摇 授 得 比 真 鸡 子 要 快 一 一 即使 每 次 
查找 一 个 User 时 都 循环 一 个 包含 50 个 条 目的 列表 。 


测试 桩 和 伪造 对 象 往往 是 救命 稳 草 ， 你 可 以 在 测试 时 用 它们 蔡 换 挥 缓慢 的 真实 事物 ， 以 及 著 长 莫 及 的 依赖 。 然 而 ， 这 两 种 基 
本 的 测试 替身 不 忌 是 够 用 。 有 时 你 友 现 自己 面 对 一 堵 墙 ,希望 目 己 能 像 干 里 上 腿 一 样 看 透 它 一 一 为 了 验证 代码 行为 符合 预期 。 那 
些 情况 下 ， 你 可 能 会 求助 于 测试 旧 谍 。 


3.2.3 ”测试 间谍 偷 取 秘密 


你 如 何 测 试 下 列 方法 ? 
Bullae Scan CONGat(StrIng flirt .SLEING SEGONG) TY sa | 
大 多 数 人 会 讽 ， 把 这 个 那个 传 进去 ， 然 后 检查 返回 值 是 什么 的 。 那 可 能 没 问题 。 毕 葛 正 确 的 返回 值 是 你 最 天 心 的 。 那 么 ， 下 
询 方 法 又 如 何 测试 ? 
DuUuplac VolQ flilter(List<?> li1st, Predlcate<?> predlicate}) 1 ... J} 
这 里 并 没有 返回 值 可 以 用 来 断言 。 这 个 方法 所 做 的 事情 是 接收 一 个 列表 和 一 个 谓词 (predicate) ， 过 滤 列 表 中 不 满足 谓词 


的 条 目 。 换 句 话 说 ， 验 证 这 个 方法 正常 工作 的 唯一 方式 就 是 事后 检查 列表 。 这 就 像 警 察 甲 底 ， 然 后 汇报 她 看 到 的 一 切 。(1 通 常 你 
不 用 测试 替身 也 能 做 到 这 一 点 。 这 个 例子 中 你 可 以 询问 List 对 象 ， 看 它 是 否 包含 你 所 期 望 的 条 目 。 


全 于 测试 著 身 一 一 我 们 正在 讨论 的 测试 间 读 〈 人 简称 3pPy) 的 方便 之 处 在 于 ， 当 没有 对 象 作为 参数 传 入 时 ， 通 过 它们 的 
APl 也 能 揭示 你 想 要 了 解 的 知识 。 代 码 清 单 3.5 显 示 了 这 样 一 个 例子 。 





代码 清单 3.5 测试 间谍 的 例子 一 一 参数 没有 为 测试 提供 足够 的 情报 





public class DLog { 


private final DLogTarget[] targets; 了 站 DLog 提供 了 一 些 
LLoglarget 
public DLog (DLogTarget... targets) { 
this.targets = targets; 
} 
public void write(Level level, String message) { 每 个 target 接收 
for (DLogTarget each : targets) { 到 相同 的 消息 
each.write(level, message); 
} 
} 
} 0 i 
DLogTarget 仅仅 定 
public interface DLogTarget { 了 义 了 write() 方法 
void write(Level level, String message),， 
} 


我 们 先 来 看 看 上 述 代 码 清单 中 的 场景 。 被 测 对 象 是 一 个 分 布 式 的 日 志 对 象 DLog， 代 表 了 一 组 DLogTarget@Q。 当 向 DLog 写 
入 时 ， 你 应 该 向 所 有 DLogTarget 写 入 相同 的 消息 仿 。 从 测试 的 角度 来 看 ， 事 情 有 点 尴 众 ， 你 无 法 知道 指定 的 消息 是 否 被 写 入 ， 
因为 DLogTarget 接 口 只 定义 了 一 个 方法 write0 合 ,而 且 DLogTarget、ConsoleTarget 和 RemoteTarget 的 真实 实现 也 都 没有 提 
供 任何 方法 。 


测试 间 读 登 场 了 。 代 码 清 单 3.6 展 示 了 一 个 精明 的 程序 员 如 何 鞭 打 他 的 女 特工 去 干 活 。 


代码 清单 3.6 ”测试 间谍 通常 很 容易 实现 


public class DLogTest { 
GTest 
public void writesEachMessageToAllTargets() throws Exception { 
SpyTarget spyl = new SpyTarget ( ) ; 
SpyTarget spy2 = new SpyTarget ( ) ; 


DLog log = new DLog(spyl, spy2); -—@ 间谍 潜入 
log.writel(Level.INFO, "message"); 

assertTrue (spyl.received(Level.INFO, "message" ) ) ; 人 
aSSsertTrue (spy2 .recelVved (Leve1lL .INFO， "message" ) ) ; 


} 


private class SpyTarget implements DLogTarget { 


private List<String> log = new ArrayList<String> () ; 
人 WIT + 
public void write(Level level, String message) { 蛛丝马迹 
log.add (concatenated(level, message)); 
} 
boolean received(Level level, String message) { 让 测试 
_yY 人 ]」 EIN 
return log.contains (concatenated(level, message)); 来 间 话 
} 、 4 时 


private String concatenated(Level level, String message) { 
return level .getName() + ": " + message; 


} 


这 就 是 测试 间谍 的 一 切 。 像 其 他 测试 替身 一 样 ， 你 将 它们 传 入 @Q@。 然 后 你 令 测试 间谍 全 记录 已 发 送 的 消息 ， 并 会 让 测试 询问 


测试 间谍 是 否 收 到 指定 消息 。 干 得 漂亮 ! 


倘 而 言 之 ， 测 试 间谍 是 一 种 测试 蔡 身 ， 它 用 于 记录 过 去 友 生 的 情况 ， 这 样 测试 在 事后 就 知道 所 友 生 的 一 切 。 有 时 我 们 进一步 
利用 这 个 概念 ， 于 是 测试 间谍 束 变 成 了 全 能 的 模拟 对 象 。 如 果 测 试 间谍 像 个 卧底 警察 ， 那 么 模拟 对 象 束 像 渗 入 暴民 的 远程 控制 机 


器 人 。 这 可 能 需要 一 些 解 释 ..………. 


3.2.4 ”模拟 对 象 反 对 惊喜 


模拟 对 象 (简称 Mock) 是 特殊 的 Spy。 它 是 一 个 在 特定 情景 下 可 配置 行为 的 对 象 。 例 如 ，UserRepository 接 口 的 模拟 对 象 
可 能 被 告 之 : 当 市 着 参数 123 调 用 findByld(0 时 要 返回 null， 而 当 融 着 参数 124 调 用 findByld(0 时 要 返回 User 的 一 个 实例 。 在 这 一 
点 上 ， 我 们 主要 讨论 的 是 根据 参数 来 对 特定 的 方法 调用 打桩 。 


如 果 一 旦 任何 意外 友 生 时 Mock 束 立即 使 测试 失败 ，Mock 束 能 够 变 得 更 加 精确 。 例 如 ， 假 设 我 们 告诉 了 模拟 对 象 如 何 应 对 
市 着 123 或 124 的 findByld0 调 用 ， 它 束 会 严格 按照 指令 工作 。 对 于 任何 其 他 的 调用 一 一 不 论 是 调用 不 同 的 方法 或 者 市 着 另外 的 
参数 调用 findByld0 一 一 Mock 就 会 抛 出 异常 ， 直 接 使 测试 失败 。 同 样 ， 如 果 findByld0 被 调用 太 多 次 ，Mock 束 会 抱 息 一 一 除非 
我 们 告诉 它 允 许 调 用 任意 次 数 一 一 如 果 预 期 的 调用 没 友 生 ，Mock 也 会 抱怨 。 











包括 JMock、Mockito 和 EasyMock 在 内 的 模拟 对 象 库 已 经 是 成 熟 的 工具 了 ， 尝 尚 测试 的 程序 员 可 以 借助 它们 获得 力量 。 
个 库 都 有 目 己 的 行事 风格 ,但 基本 上 你 可 以 用 它们 中 任何 一 个 来 完成 所 有 的 工作 。 


这 并 非 模拟 对 象 库 的 全 面 教程 ， 但 是 我 们 迅速 看 看 代码 清单 3.7 中 的 例子 ， 它 展示 了 这 种 库 的 具体 用 法 。 这 里 我 们 使 用 
JMock， 因 为 我 磁 巧 有 个 项 目 正在 使 用 JMock。 


代码 清单 3.7 JMock 人 允许 你 在 运行 时 配置 mock 


OBLlie class TestTranslator | 
protected Mockery context; 


QBefore 

public void createMockery() throws Exception { 
context = new JUnit4Mockery(); 

} 

GTest 

public void usesInternetForTranslation() throws Exception { 
final Internet internet = context.mock (Internet.class),; 


context.checking (new Expectations() {t{ 
one (internet) .get (with(containsString("langpair=en%7Cfi"))); 
will(returnValue("{\"translatedText\":\"kukka\"}"))}); 

Ee 


Translator 七 = new Translator (internet)., 
String translation = t.translate("flower", ENGLISH, FINNISH).; 
assertEquals ("kukka", translation).; 


在 这 样 一 小 段 测 试 代码 中 ， 这 个 例子 展示 了 许多 模拟 对 象 库 用 法 的 典型 构造 。 百 移 ， 我 们 告诉 库 要 为 指定 接口 创建 一 个 模拟 
对 象 。 


在 context.checking() 中 看 似 条 拙 的 代码 块 其 实 是 测试 在 指导 模拟 的 Internet， 告 诉 它 应 该 期 待 哪些 交互 ， 以 及 如 何 应 对 这 
些 交 互 。 这 种 情况 下 ， 我 们 预期 测试 会 带 着 包含 "langpair=en9%7Cfi" 字 符 串 的 参数 调用 get() 方 法 一 次 ， 对 此 ，mock 应 当 返 回 


最 终 ， 我 们 将 Mock 传 给 被 测 的 Translator 对 和 象 ， 执 行 Translator， 然 后 断言 Translator 为 我 们 的 场景 提供 了 正确 的 翻译 。 


然而 ， 这 并 非 我 们 的 全 部 断言 。 如 前 所 述 ，Mock 可 以 严格 地 判断 已 经 友 生 的 预期 交互 。 在 模拟 Internet 的 例子 中 ，Mock 
严格 地 断言 它 确实 收 到 了 一 次 市 有 指定 子 字 符 串 参数 的 get(0 万 法 调用 。 


[1 我 承认 ， 我 电视 看 多 了 ， 但 是 测试 间谍 就 像 那 样 。 


3.3 ”使 用 测试 蔡 身 的 指南 





测试 蔡 身 是 程序 员 的 工具 ， 残 像 木 折 的 锤子 和 钉子 。 仓 在 禹 钉子 的 适当 方式， 当然 也 有 不 恰当 的 方式 一 最 好 是 能 把 它们 
识别 出 来 。 


先 从 我 认为 最 重要 的 指南 开始 吧 ， 当 你 求助 于 测试 蔡 身 时 要 时 刻 牢记 它 一 一 从 你 的 工具 箱 中 选择 合适 的 工具 。 


3.3.1 ”为 测试 挑选 合适 的 蔡 刁 


有 许多 测试 替身 可 供 选 择 ， 它 们 看 起 来 各 有 干 秋 。 米 用 它们 的 最 佳 条 件 是 什么 ? 到 底 应 该 选择 哪个 ? 


这 里 并 没有 太 多 的 硬性 规定 ， 但 一 般 来 说 你 应 该 因地制宜 地 混合 使 用 。 我 是 说 ， 某 些 情 况 下 你 只 想 要 “一 个 返回 5 的 对 
象 ”， 而 其 他 情况 下 你 特别 想 知 道 某 个 方法 被 调用 过 。 有 时 在 一 个 测试 中 对 两 者 都 感 兴趣 ， 于 是 你 将 Stub、Fake 和 Mock 一 同 
使 用 。 


前 面 已 经 说 过 ， 并 没有 清晰 的 原则 来 决定 及 用 哪 种 方式 以 得 到 最 可 读 的 测试 。 但 我 还 是 忍 不 住 对 如 何 选择 这 个 问题 阐述 一 些 
逻辑 和 局 友 : 
如果 你 关心 某 些 交互 ， 即 两 个 对 象 之 间 的 方法 调用 ， 你 可 能 会 需要 一 个 模拟 对 象 Mock。 


` 如 果 你 决定 使 用 Mock， 但 测试 代码 最 终 看 起 来 不 像 你 想 的 那样 漂亮 ， 那 就 看 看 一 个 手工 的 简单 测试 间谍 Spy 能 否 满足 需 


. 如 果 你 只 关心 协作 对 象 向 被 测 对 象 输送 的 响应 ， 用 桩 Stub 就 可 以 。 


. 如 果 你 想 运行 一 个 复杂 场景 ， 其 中 它 所 依赖 的 服务 或 组 件 无 法 供 测试 使 用 ， 而 你 对 所 有 交互 打桩 的 快速 尝试 却 夏 然而 止 ， 
或 产 出 了 难以 维护 的 糟糕 的 测试 代码 ， 那 就 考虑 实现 一 个 伪造 对 象 Faker 吧 。 





` 如 果 上 述 都 不 能 满足 你 手 上 的 特殊 情况 ， 那 就 抛 硬 币 吧 正面 代表 Mock， 反 面 代 表 Stup， 如 果 硬 币 直立 ， 我 允许 你 找 


一 个 Fake 帮 你 干 活 。 


如 果品 得 那个 列表 太 难 记 ， 别 怕 。 《JUnit Recipes》 (Manning，2004) 的 作者 上 B.Rainsberger 有 一 个 简单 的 记忆 规则 ， 
用 于 选择 正确 的 测试 蔡 身 类 型 : Stub 管 查询 ，Mock 管 操作 。 现 在 我 们 顺利 地 得 到 启发 ， 知 道 什 么 时 候 该 用 哪 种 测试 蔡 身 了 ， 接 
下 来 看 看 如 何 使 用 它们 。 


3.3.2 准备、 执行 、 断 言 


天 于 编码 约定 (convention) ， 我 要 说 几 句 。 问 题 是 各 种 标准 太 多 了 。 六 运 的 是 ， 当 你 构造 单元 测试 时 ， 和 存在 一 个 大 多 数 
程序 员 都 认为 合理 的 、 相 当 确定 的 实践 。 它 叫做 准备 -执行 -断言 (Arrange-Act-Assert) ， 这 种 组 织 测试 的 方式 基本 上 是 这 样 
的 ， 先 准备 用 于 测试 的 对 象 ， 然 后 触 友 执行 ， 最 后 对 输出 进行 断言 。 


代码 清单 3.8 复 制 了 代码 清单 3.7 的 测试 ， 我 们 看 它 如 何 符合 这 种 约定 来 组 织 测 试 方法 。 


代码 清单 3.8 准备 -执行 -断言 使 结构 变 得 清晰 


QTest 
public void usesInternetForTranslation() throws Exception { 
final Internet internet = context .mock (Internet.class).，; 全 
context.checking (new Expectations() {t{ ) 信 名 
/4 芋 合 


one (internet) .get (with(containsString ("langpair=en%7Cf1i"))).; 
will(returnValue("{\"translatedText\":\"kukka\"}")): 
关中 


Translator 七 = new Translator (InteLrnet ) ; 
String translation = t.translate("flower", ENGLISH, FINNISH); -一 人 执行 


SsertEouale ("kUukka", translationy):; -+—© 上 晰 言 


注意 我 在 三 段 代码 之 间 增 加 空白 的 方式 。 这 用 来 强调 三 段 代码 的 不 同 角 色 。[ 


测试 的 前 五 行 是 准备 @@ 所 要 用 到 的 协作 对 象 。 虽 然 其 中 我 们 只 涉及 Internet 接 口 的 一 个 Mock， 但 是 在 测试 开头 设置 多 个 协 
对 它 的 实例 化 也 是 准备 工作 的 一 部 分 。D 





作者 的 情况 也 很 常见 。 然 后 是 被 测 对 象 Translator 


下 一 段 代 码 中 ， 我 们 调用 translation@ (被 测 的 翻译 功能 ， 最 后 ， 不 论 预 期 输出 是 直接 输出 还 是 造成 的 副作用 ， 我 们 都 


给 定 - 当 -那么 (Given，When,， Then) 
行为 驱动 开发 运动 所 推广 的 词汇 和 结构 与 “准备 -执行 -断言 很 像 : 给 定 ( 某 个 上 下 文 ) ， 妆 (发 生 某 些 事情 ) ,那么 (期 
望 某 些 结果 ) 。 这 个 想法 以 更 加 直观 的 语言 来 指定 预期 行为 ， 尽 管 “ 准 备 -执行 -断言 ”更 好 记 ， 但 “给 定 - 当 - 那 么 ”更 流畅 ， 使 
人 们 更 加 自然 地 思考 行为 (而 不 是 实现 细节 ) 。 
这 种 结构 相当 普遍 ， 它 有 助 于 使 测试 保持 专注 。 如 果 感 党 三 部 分 中 某 一 部 分 很 “大 ”， 那 就 是 一 个 信号 ， 表 明 测 试 可 能 试图 
做 太 多 事情 ， 需 要 更 加 专注 。 既 然 说 到 这 话题 ， 咱 们 就 简单 讨论 一 下 测试 应 该 专注 什么 。 


3.3.3 ”检查 行为 ， 而 非 实现 


人 都 会 犯错 误 。 模 拟 对 象 库 新 手 常 犯 的 一 个 错误 是 过 度 细致 地 对 Mock 设 置 期 望 。 我 指 的 是 在 测试 中 ， 对 测试 可 能 涉及 的 每 
个 对 象 都 做 Mock， 每 个 对 象 间 的 万 法 调用 都 严格 指定 。 


是 的 ， 某 种 意义 上 ， 测 试 给 予 我 们 确定 性 ， 只 要 有 任何 变更 它 束 会 中 断 并 报警 。 而 这 也 是 问题 所 在 一 一 即使 是 最 小 的 变 
哪怕 它 与 测试 所 要 验证 的 不 相关 ， 也 会 中 断 测试 。 好 比 在 一 片 口香糖 上 密 密 斥 厅 地 裔 了 许多 钉子 ， 使 之 动弹 不 得 。 


闻 


这 种 测试 的 基本 问题 是 缺乏 专注 。 一 个 测试 应 当 只 测试 一 件 事情 ， 并 好 好 地 测试 ， 清 晰 地 沟通 自己 的 意图 。 看 着 被 测 对 象 ， 
你 要 问 自己 到 底 什么 是 想 要 验证 的 预期 行为 ”至 于 实现 细节 ， 倒 是 并 不 需要 钉 在 我 们 的 测试 中 。 


预期 行为 应 该 配置 在 Mock 对 象 的 期 望 中 。 应 该 寻求 通过 Stub 或 非 严 格 Mock 来 提供 实现 细节 ， 它 们 不 介意 交互 从 未 发 生 或 
者 皮 生 多 次 。 


检查 行为 ， 而 非 实 现 。 当 你 掏 出 喜爱 的 模拟 对 象 库 时 ， 你 应 该 牢 牢 记 住 这 一 点 。 这 到 这 里 …… 


3.3.4 ”挑选 你 的 工具 


说 到 模拟 对 象 库 ，Java 程 序 员 真是 占 了 大 便宜 一 一 有 太 多 可 以 选择 的 。 像 我 之 前 提 到 的 ， 你 几乎 可 以 用 任何 先进 的 库 来 做 
同样 的 事情 ， 但 是 它们 在 API 方 面 还 是 有 些 细微 的 区 别 以 及 一 些 独特 的 功能 ， 从 而 在 满足 某 些 特定 方向 和 需求 时 能 够 一 锤 定 音 。 


或 许 其 中 最 独特 的 功能 就 是 Mockito 的 打桩 与 验证 分 离 。 这 得 细 说 ， 接 下 来 看 个 例子 ， 我 用 Mockito 重 写 了 之 前 采用 JMock 
的 测试: 


GTest 
public void usesInternetForTranslation() throws Exception { 
final Internet internet = mock(Internet.class);} 


when (internet.get (argThat (containsString("langpair=en%7Cfi")))) 
.thenReturn("{\"translatedText\": \"kukka\"}").;， 


Translator translator = new Translator(internet); 
String result = translator.,.translate("flower", ENGLISH, FINNISH)}); 
assertEquals ("kukka", result); 


Mockito 的 API 比 JMock 更 简洁 。 除 此 之 外 ， 看 起 来 磊 不 多 ， 是 不 是 ? 是 的 ， 只 是 这 个 用 Mockito 写 的 测试 仅仅 对 方法 get() 
打桩 一 一 即使 交互 从 未 发 生 ， 它 也 会 成 功 通过 。 如 果 我 们 真 的 希望 验证 Translator 使 用 Internet 的 行为 ， 我 们 就 得 增加 一 个 对 
Mockito API 的 调用 来 进行 检查 : 


verify(internet) .get (argThat (containsString ("langpair=en%7Cf1i"))).; 


或 者 ， 如 果 感 党 不 必 那 么 精确 : 


verify(internet) .get (anyString()); 


模拟 对 象 库 API 通 剃 是 个 人 喜好 问题 。 但 是 Mockito 在 测试 风格 上 有 一 个 明显 的 优势 ， 那 就 是 主要 依赖 于 打桩 一 一 在 你 的 特 
定 上 下 文中 这 可 能 是 优势 ， 也 可 能 不 是 。 测 试 代码 每 天 都 保持 可 读 、 简 洁 、 可 维护 ， 这 才 是 关键 。 这 值得 停 下 来 权衡 一 下 ， 明 智 
地 选择 工具 。 


咱们 再 次 借用 J.B. 的 话 来 明确 JMock 与 Mockito 在 方式 和 适用 条 件 方面 的 区 别 : [4 
当 我 想 要 拯救 遗留 代码 上 时， 我 选择 Mockito。 当 我 想 要 设计 新 功能 时 ， 我 选择 JMock。 


JMock 与 Mockito 不 同 的 前 提 假 设 ， 使 得 两 者 擅长 不 同 的 任务 。 默 认 情 况 下 ，JMocKk 认 为 测试 替身 (Mock) 期 望 着 客户 不 会 在 
任何 时 候 调 用 任何 方法 。 如 果 你 想 放宽 这 个 假设 ， 你 就 得 增加 一 个 stub。 另 一 方面 ，Mockito 认 为 测试 替身 (也 叫 Mock) 允许 客 
户 在 任何 时 候 调 用 任何 方法 。 如 果 你 想 加 强 这 个 假设 ， 那 么 你 就 得 验证 某 个 方法 的 调用 。 这 就 是 区 别 所 在 。 


不 论 你 决定 选择 哪个 库 ， 我 们 的 第 三 个 即 最 后 一 个 测试 替身 指南 全 都 适用 。 
3.3.5 ”注入 依赖 
为 了 能 够 使 用 测试 蔡 身 ， 你 需要 一 种 替换 真实 事物 的 方法 。 当 涉及 依赖 时 一 一 为 了 测试 目的 而 替换 协作 对 象 一 一 我 们 的 指 


南 建 议 不 要 在 同一 个 地 方 同时 实例 化 和 使 用 它们 。 在 实践 中 ， 这 意味 着 将 这 些 对 象 男 存 为 私有 成 员 ， 或 借助 工厂 方法 来 获取 它 
们 。 





一 旦 你 隔离 开 依赖 ， 你 就 需要 访问 它 。 你 可 以 用 可 见 性 修饰 符 来 破坏 封装 一 一 将 私有 (private) 内 容 变 成 公开 (public) 
或 者 包 级 私有 (package private) 或 使 用 反射 APl 来 将 测试 蔡 身 分 配给 私有 字段 。 那 种 方式 很 快 就 会 变 得 丑陋 。 更 好 的 选 
择 是 采用 依赖 注入 ， 从 外 部 将 依赖 传递 给 对 象 ， 通 常 使 用 构造 函数 注入 ， 正 如 在 Translator 例 子 中 那样 。b| 





我 们 对 于 测试 蔡 身 说 得 够 多 了 ， 我 渴望 进行 第 二 部 分 了 ， 接 下 来 对 本 章 学 到 的 东西 做 一 个 回顾 吧 。 


[1] ”如 果 你 决定 使 用 Stub,， 但 你 的 测试 中 也 有 Mock， 那 就 考虑 使 用 你 选择 的 模拟 对 象 库 来 创建 Stub 
使 测试 代码 更 养眼 。 
[2] 尽管 空白 肯定 会 被 滥用 ,但 一 致 地 使 用 空白 有 助 于 程序 员 更 容易 地 看 清 测 试 的 结构 。 


[3] 技术 上 讲 ， 为 Mock 设置 期 望 是 一 种 验证 行为 一 一 是 断言 ， 而 不 是 准备 工作 。 但 这 里 将 Mock 用 于 Stup。 有 人 说 这 是 焉 门 那 道 





它 也 能 做 到 那样 ， 而 且 会 


一 一 他 们 说 得 对 。 
[4] J. B. Rainsbergerblog, 《JMock v. Mockito, but Not to the Death»》 , 2010.10.5, http://mneg.bz/yW2m. 


[5] 注意 ， 依 赖 注入 并 不 意味 着 必须 使 用 一 个 依赖 注入 框架 。 通 过 构造 函数 简单 地 将 依赖 传 入 就 够 了 ! 


3.4 小 结 


我 们 从 使 用 测试 蔡 身 的 理由 开始 ， 先 探讨 了 测试 茶 身 的 话题 。 这 尝 原因 育 后 的 共同 点 是 需要 隅 离 被 测 代码 ， 这 样 你 残 能 模拟 
出 所 有 场景 ， 并 且 测 试 到 代码 应 该 表现 出 的 所 有 行为 。 


有 时 ， 使 用 测试 蔡 身 的 理由 是 希望 测试 运行 得 更 快 。 及 用 简单 实现 的 测试 替身 ， 通 常 比 它 们 替换 挥 的 实现 要 快 一 到 两 售 。 有 
时 ,被 测 代 码 依赖 于 随机 或 其 他 不 确定 的 行为 ， 比 如 时 间 。 这 些 情 况 下 ,测试 蔡 身 通过 将 不 可 预测 变 得 可 预测 而 使 测试 变 得 简 
时 


对 于 模拟 某 些 特殊 情况 并 验证 对 象 的 预期 行为 ， 测 试 替身 可 能 是 仅 有 可 行 方式 ， 而 不 必 仪 为 了 可 测 性 而 修改 产品 代码 的 设计 


,暴露 细 方 


过 


O 


除了 测试 蔡 身 市 来 的 好 处 ,我 们 继续 学 习 了 四 种 测试 替身 之 间 的 区 别 : 测试 桩 、 伪 造 对 象 、 测 试 间 读 、 模 拟 对 象 。 极 厦 简 约 
的 桩 或 诗 最 适合 切断 不 相关 的 协作 者 。 当 真实 事物 难以 使 用 或 比较 麻烦 时 ， 伪 造 对 象 提 供 了 闪电 般 的 变换 。 测 试 间谍 用 来 访问 隐 
藏 的 信息 和 数据 ， 而 模拟 对 象 像 打 了 激素 的 测试 间谍 ， 增 加 了 动态 配置 行为 的 能 力 ， 并 验证 预期 的 交互 确实 会 友 生 。 


我 们 从 各 种 测试 蔡 身 使 用 的 时 机 和 场景 开始 ， 以 一 些 测试 蔡 身 的 基本 使 用 所 南 来 结束 本 章 。 尤 其 是 ， 当 使 用 模拟 对 象 时 ， 直 
免 过 么 地 钉 住 实现 是 很 重要 的 。 你 的 Mock 应 当 验 证 预期 行为 ， 而 尽量 放 过 行为 的 具体 实现 。 


通常 ， 工 具 可 以 提供 极 大 的 帮助 ， 而 且 信 得 为 你 的 特殊 需要 以 及 模拟 对 象 的 使 用 风格 来 评估 最 合适 的 库 。 最 后 ， 选 择 从 外 部 
注入 依赖 ， 而 不 是 从 被 测 代码 内 部 硬 连接 它们 ， 将 会 市 来 截然 不 同 的 可 测 性 。 


本 草 讲 了 测试 蔡 身 ， 第 一 部 分 也 到 此 结束 。 我 们 现在 探讨 了 编写 良好 测试 的 基础 。 先 是 理解 编写 测试 的 好 处 ， 然 后 了 解 测试 
应 该 具有 的 属性 ， 接 下 来 操控 程序 员 最 基本 的 测试 工具 一 测试 蔡 身 一 一 你 现在 掌握 了 足够 的 基本 技能 ， 你 已 经 可 以 开始 进 一 
步 磨炼 了 。 特 别 是 ， 你 已 经 准备 好 开始 训练 对 各 种 不 民 测 试 的 感 况 ， 从 表现 展 好 到 令 人 头痛 ， 到 地 板 上 的 内 体 子 ， 甚 至 是 彻 头 彻 
尾 的 维护 负担 。 该 是 进入 第 二 部 分 并 关注 坏 味道 的 时 候 了 。 





那 正 是 测试 坏 味 进 。 


第 二 部 分 的 目标 是 帮助 我 们 更 好 地 识别 并 修复 测试 代码 中 的 问题 ， 我 们 用 一 种 “目录 风格 的 方式 来 进行 。 这 个 目录 是 关于 
指 我 们 经 常 在 测试 代码 中 遇 到 的 属性 和 特征 ， 它 们 会 造成 和 加 剧 各 种 问题 ， 包 括 可 维护 性 、 可 读 性 、 可 信赖 性 。 





测 会 坏 味道 


我 们 沉迷 于 这 些 反 模式 ， 而 非 列举 一 些 良 好 实践 ， 因 为 我 发 现 教程 序 员 识别 和 纠正 问题 是 更 加 有 效 的 方式 。 毕 竞 ， 如 果 我 们 
只 知道 好 的 测试 长 什么 样 ， 我 们 仍然 对 许多 缺陷 视而不见 。 


我 的 好 友 Bas Voddel1| 喜 欢 这 样 说 ， 如 果 你 去 挤 了 所 有 识别 到 的 测试 坏 味道 ， 那 么 剩 下 的 基本 上 就 是 一 个 相当 优秀 的 测试 
了 。 同 时 ， 优 秀 生产 代码 的 设计 原则 和 指导 方针 对 于 测试 代码 也 同样 有 效 也 就 是 说 ， 我 们 已 经 能 够 判断 测试 代码 所 应 当 有 具备 
的 属性 。 





测试 坏 味道 的 目录 分 为 三 个 章节 ， 各 自 围绕 一 个 主题 收集 了 一 组 坏 味道 。 第 4 章 展示 了 破坏 测试 可 读 性 的 坏 味道 。 第 5 章 继续 


对 破坏 可 维护 性 的 测试 提供 建议 。 第 6 章 用 有 关 脆 弱 或 不 可 靠 的 测试 坏 味道 来 结束 这 一 部 分 。 


这 种 分 类 基于 每 个 坏 味道 最 主要 的 影响 一 菜 些 坏 味道 很 容易 分 入 多 个 章节 中 ! 目录 中 的 许多 坏 味道 也 紧密 地 相关 联 ， 并 且 
经 常 携手 出 现在 代码 中 。 我 们 肯定 会 在 适当 的 时 候 指出 这 些 关 联 。 某 些 坏 味 道 恰 好 处 在 两 个 极端 一 一 极端 情况 毕竟 难以 做 到 最 优 


的 。 我 们 肯定 也 会 指出 这 些 关 联 。 





好 了 。 该 是 挽 起 袖子 干 活 的 时 候 了 。 





[1] Bas Vodde 是 译 者 申 健在 诺基亚 的 前 同事 。 译 者 注 


第 4 草 可 读 性 


本 草 内 容 包 括 : 
` 围绕 断言 的 测试 坏 味道 
` 代码 中 信息 分 散 的 测试 坏 味道 
` 细节 过 度 或 不 相关 的 测试 坏 味道 


程序 员 用 测试 的 方式 来 表达 和 验证 代码 的 假设 和 预期 行为 。 阅 读 测 试 代 码 之 后 ， 融 该 理解 代码 应 当做 什么 。 程 序 员 运 行 那些 
测试 时 ， 融 该 了 解 代 码 实际 上 在 做 什么 。 


断言 扮演 着 破译 代码 行为 的 关键 角色 。 尽 管 所 有 组 成 测试 的 代码 共同 讲述 了 被 测 代码 的 预期 行为 ， 但 正 是 断言 做 出 了 结案 陈 
词 。 我 们 所 研究 的 断言 能 够 辨别 代码 是 否 满足 了 期 望 。 同 样 ， 在 测试 执行 中 ， 测 试 框架 使 用 相同 的 断言 来 检查 我 们 的 假设 。 


因此 本 章 中 要 讨论 的 许多 问题 都 围绕 着 断言 ， 但 测试 中 其 他 代码 的 可 读 性 也 同样 重要 一 一 安排 夹具 的 代码 ， 以 及 调用 或 触 
友人 馈 测 代码 动作 的 代码 。 


总 的 来 况 ， 本 章 中 我 们 关注 表现 不 民 的 测试 代码 所 具有 的 各 种 坏 味道 和 上 问题。 那些 问题 增加 了 程序 员 的 认 知 负担 ， 使 测试 意 
图 和 内 容 难以 阅读 和 理解 。 


毕 葛 ， 上 阅读 测试 代码 不 该 是 件 难 事 。 你 不 该 绞 尽 脑汁 并 挑战 目 己 的 短期 记忆 极限 才能 读 慌 测 试 。 但 有 时 我 们 还 是 会 撞 到 那些 
曾经 见 过 多 次 的 讨 大 家 伙 。 那 只 有 10 行 的 讨 大 家 伙 看 起 来 束 像 是 斯 瓦 希 里 语 、 希 伯 来 语 和 古代 经 文 的 混合 体 。 


这 种 测试 坏 味道 大 量 存 在 ,但 有 一 种 特别 常 丸 ， 束 是 不 断 困 扰 着 人 们 的 基本 断言 。 


4.1 基本 断言 


断言 应 该 表达 某 种 假设 或 意图 。 它 们 应 该 声明 代码 的 行为 。 基 本 断言 的 问题 在 于 它们 缺乏 意义 ， 因 为 断言 的 基本 原理 和 意图 
隐藏 在 看 上 去 无 意义 的 单词 和 数字 背后 ， 造 成 它们 难以 理解 ， 并 且 难 以 验证 断言 的 正确 性 。 


换 句 话说 ， 相 比 要 检查 的 行为 ， 基 本 断言 使 用 了 更 基本 的 元 素 。 我 们 来 看 一 个 散发 着 这 种 坏 味道 的 例子 。 
4.1.1 示例 
如 代码 清单 4.1 所 示 ， 我 们 的 例子 展示 了 一 个 全 局 正则 搜索 (grep) 程序 的 测试 。grep 程 序 其 实 束 是 逐 行 处 理 东 种 文本 输 


入 ， 在 处 理 时 可 以 包括 或 排除 挥 含有 特定 子 串 或 模式 的 文本 行 。 测 试 应 当 是 你 的 对 象 所 提供 功能 的 具体 例子 ， 那 么 我 们 来 看 一 看 
这 个 测试 是 否 襄 清楚 了 grep 程 序 该 做 的 事情 。 但 愿 这 个 测试 没有 受到 基本 断言 的 折磨 ! 


代码 清单 4.1 基本 断言 不 必要 地 增加 了 你 的 认 知 负担 


GTest 

public vold outputHasLineNumbers() { 
String content = "1st match on #1l\nand\n2nd match on #3"; 
String out = grep.grep("match", "test.txt", content): 
assertTrue (out.indexOf ("test.txt:1 lst match") != -1); 
assertTrue(out.indexOof ("test.txt:3 2nd match") != -1); 


那么 ， 这 个 测试 在 干什么 ? 首先 ， 我 们 定义 了 文本 字符 串 content 来 表示 一 段 输入 ， 然 后 调用 grep 程 序 ， 然 后 对 grep 结 
输出 中 的 某 些 东西 进行 断言 。 这 些 东 西 束 是 问题 所 在 。 断 言 的 目标 并 不 清楚 ， 因 为 断言 过 于 基本 一 一 尼 与 测试 的 其 他 部 分 说 着 
不 同 的 语言 。 


有 具体 来 说 ， 我 们 在 这 个 断言 中 要 计算 输出 结果 中 的 另 一 个 文本 字符 串 的 索引 ， 并 将 其 与 -1 进行 比较 ; 如 果 索 引 为 -1， 那 么 测 
试 失 败 。 测 试 的 名 字 叫 做 outputHasLineNumbers， 显 然 ， 对 于 在 代码 清单 4.1 中 grep(0 的 具体 调用 ， 输 出 结果 应 当 包 含 正 在 进 
行 逐 行 查找 的 文件 名 ， 后 面 加 上 行 号 。 


遗憾 的 是 ， 我 们 不 得 不 经 过 这 个 思考 过 程 才能 理解 为 什么 我 们 要 计算 索引 ， 为 什么 查找 test.txt: 1 而 不 是 其 他 东西 ， 为 什么 
与 -1 进行 比较 ， 当 索引 是 -1 或 不 是 -1 时 测试 是 否 会 失败 ? 这 无 需 火 稍 科 学 [就 能 找到 答案 ， 但 却 是 我 们 大 脑 的 不 必要 的 认 知 工 
作 。 


4.1.2 ”该 对 它 做 点 儿 什 么 


基本 断言 其 实 是 抽象 层次 过 低 。 考 虑 到 这 一 点 ， 我 们 至 少 可 以 为 上 述 例子 找到 一 些 潜在 的 改进 方法 。 


第 一 个 改进 是 关于 去 掉 魔 法 数字 -1 周围 的 复杂 逻辑 。 与 其 将 主要 的 assertTrue 与 ! = 比较 符 组 合 在 一 起 ， 不 如 改 用 JUnit4 引 
入 的 assertThat 语 法 来 使 该 逻辑 变 得 清晰 ， 如 代码 清单 4.2 所 示 。 


代码 清单 4.2 ”JUnit4 的 assertThat 语 法 有 助 于 断言 变 得 可 读 


GTest 

public void outputHasLineNumbers() { 
String content = "lst match on #1l\nand\n2nd match on #3",， 
SET Out = grep SEE “pest txt",. contentys 
desereThat (ow anoerort ("est REL Tet watenr™), Ts (me) 
assertThat (out .indexOf ("test .txt:3 2nd match"), is (not(-1))):; 


我 们 使 用 assertThat 语 法 以 及 Hamcrest 匹 配器 工具 : is 和 not。 这 个 小 改动 减轻 了 我 们 大 脑 的 负担 ， 我 们 不 用 再 考虑 是 否 应 
该 期 望 索引 等 于 -1。 现 在 用 简单 的 英语 就 清楚 地 表达 了 意图 。 加 

第 二 个 潜在 的 改进 涉及 我 们 用 到 的 标准 Java API 的 抽象 层次 。 具 体 来 说 ， 我 们 应 该 重新 考虑 如 何 去 判 定 在 一 个 字符 串 中 找到 
了 给 定 的 子 串 。 对 于 grep 输 出 结果 中 找到 了 给 定子 串 的 情况 ，“index" 的 概念 和 魔法 数字 -1 都 是 来 自 错误 抽象 层次 的 概念 。 基 
于 这 点 改动 ， 我 们 的 测试 大 概 会 进化 为 代码 清单 4.3 中 的 样子 。 


代码 清单 4.3 ”在 正确 的 抽象 层次 上 表达 期 望 


GTest 

public void outputHasLineNumbers() { 
String content = "let matceh on #1\nand\n2nd mateh on $3"; 
String out = grep,grep("match", "test.txt", content)}):; 
assertTrue(out. contalns("test. txt:l1 Test match"))}); 
assertTrue(out.contains ("test.txt:3 2nd match")); 


这 里 我 们 用 java.lang.String 中 的 contains 来 代 蔡 更 快捷 的 indexOf 方 式 。 再 一 次 减少 了 程序 员 阅 读 代码 的 认 知 负担 。 


最 后 ， 我 们 可 以 考虑 结合 使 用 这 些 改进 ， 使 用 更 加 语言 化 的 assertThat 方 式 ， 同 时 选用 String#containsr 碳 非 
string#indexOf。 代 码 清单 4.4 展 示 了 所 识 的 这 些 。 


代码 清单 4.4 在 正确 的 抽象 层次 上 结合 使 用 assertThat 


@Test 

public void outputHasLineNumbers() { 
SEPrITNG COntent =: "Tst matceli or #1 nanad\n2nd matel or #3”3 
Str1iTg Ou = Urep ,grep( "matehn" “test, txt Contentl:s 
assertThat (out .Contalns ("test.txt:1] 1st match"), equals (true) ) ; 
assertThat (out .Contalns ("test.txt:3 2nd match"), equals (true)); 


将 这 个 版 本 与 代码 清单 4.3 比 较 ， 你 可 以 看 到 最 后 的 改进 比 第 二 个 改进 更 元 长 ， 但 它 绝对 比 第 一 个 改进 (代码 清单 4.2) 更 加 
简洁 和 具有 表达 力 。 当 权衡 在 测试 代码 中 表达 意图 的 万 式 时 ， 你 应 该 牢记 测试 的 性 质 和 宗旨 是 更 注重 可 读 性 和 清晰 度 ， 其 次 才 是 
代码 重复 度 或 性 能 。 通 常 你 会 友 现 ， 一 后 点 额外 的 见长 更 有 利于 表现 力 、 可 读 性 和 可 维护 性 。 


深入 了 解 你 的 工具 能 帮 你 找到 一 个 好 的 方式 来 表达 意图 。 在 这 个 例子 中 ， 了 解 JUnit 及 便利 的 Hamcrest 匹 配器 的 一 小 部 分 ， 
包括 org.junit.JUnitMatchers#containsString()， 能 引导 你 朝代 码 清 单 4.5 来 演进 你 的 测试 \。 


代码 清单 4.5 “通过 正确 地 使 用 Hamcrest 匹 配器 ， 又 有 一 个 轻微 的 改进 


GTest 

public void outputHasLineNumbers() { 
String content = "1st match on #1l\nand\n2nd match on #3",; 
String out = grep.grep("match", "test.txt", content); 


assertThat (out, containsString("test.txt:1 1st match")); 
assertThat (out, containsString{("test.txt:3 2nd match")):; 


这 些 风格 中 哪些 最 符合 你 的 审美 观 ? 那 可 能 束 是 你 会 采取 的 方式 。 但 无 论 你 最 终 及 用 assertThat、assertTrue 或 


assertFalse (甚至 assertEquals) ， 你 都 希望 用 被 测 功能 的 语言 和 词汇 来 表达 你 的 断言 。 


4.1.3 ”小 结 


每 当 你 看 到 引入 != 或 == 比 较 符 的 断言 ， 特 别 是 涉及 比如 -1 或 0 的 魔法 数字 时 ， 就 问 问 自己 ,抽象 层次 是 不 是 正确 。 如 果断 
言 不 能 立即 显现 出 意义 ， 那 融 很 可 能 是 基本 上 断言， 需要 重 构 。 
这 种 测试 坏 味 站 其 实 是 代码 坏 味 道 之 基本 类 型 偏执 的 李 生 兄 向 ， 即 使 用 基本 类 型 来 代表 高 层 概念 。 


想象 一 下 用 String 来 表示 电话 号 码 ， 把 手机 局 用 的 功能 编码 为 byte， 或 者 将 移动 宽 市 订阅 拉 述 为 一 对 Date 对 象 。 在 写 测 试 
时 ， 你 应 当 专 注 于 在 它们 的 层次 上 ， 而 不 是 按照 它们 的 实现 来 表达 它们 的 概念 。 


有 时 你 的 测试 没有 偏执 于 使 用 语言 原 语 ， 而 是 偏执 于 细节 。 我 是 说 那些 如 同 办 公 室 中 事 无 巨细 的 管理 者 一 样 的 单元 测试 。 受 
到 这 种 偏执 折磨 的 测试 经 常 加 入 过 分 细节 的 断言 一 一 如 此 之 细 ， 以 致 你 会 称 它们 为 过 度 断 言 。 
译 者 注 


[1] 火箭 科学 是 指 研究 火箭 的 科学 ， 在 这 里 上 暗 指 复杂 伤神 的 工作 。 
[2] Hamctrest (https://github.com/hamcrest/JavaHamcrest) 是 一 组 API 和 匹配 器 实现 ， 其 他 库 比 如 JUnit 可 以 调用 它 ， 用 于 将 对 象 与 





各 种 期 望 进行 匹配 。 


4.2 过度 断言 
(hyperassertion ) 是 如 此 订 慎 地 记 定 每 个 竺 检查 行为 的 细节 ， 以 致 脆弱 ， 并 且 掩 盖 了 整体 广度 和 深度 之 下 
遇 到 过 度 断 言 ， 很 难说 清 它 要 检查 什么 ， 并 且 当 你 退 后 一 步 观 察 ， 会 看 到 测试 打 断 的 频率 可 能 远 超 平均 水 平 。 它 如 


一 RU 日 
巴 冬 侍 


过 度 断 言 
的 意图 。 当 你 
此 挑 吻 ， 以 致 无 论 任何 变化 都 会 造成 输出 与 期 望 不 同 。 


让 我 们 通过 一 个 遭 此 折磨 的 例子 来 更 具体 地 讨论 。 


4.2.1 示例 
下 述 示例 是 我 的 亲身 经 历 。 几 年 前 ， 我 为 医疗 公司 编写 销售 演示 跟踪 (sales presentation tracking) 系统 。 销 售 大 军 拜 访 
医生 并 推广 产品 ， 对 此 ， 公 司 希 望 收集 到 如 何 实施 演示 的 数据 。 其 实 ， 他 们 是 想 要 日 志 ， 记 录 哪个 销售 人 员 展 示 了 哪 页 讲义 ， 以 


及 停顿 时 间 等 。 
解决 方案 涉及 多 个 组 件 。 实 际 的 讲义 文件 中 存在 插件 ， 当 启动 新 的 幻灯 片 演示 、 进 入 幻灯 片 等 时 会 触发 事件 一 一 每 个 都 带 


有 表示 事件 友 生 的 时 间 戳 。 那 些 事 件 会 推送 到 后 台 程 序 并 添加 到 日 志文 件 中 。 
在 与 中 央 服 务 器 同步 日 志文 件 之 前 ， 我 们 转换 日 志文 件 的 格式 ， 对 其 进行 预 处 理 ， 使 中 央 服 务 器 更 加 容易 切割 日 志文 件 并 将 


数字 转 存 到 中 央 数 据 库 。 基 本 上 ， 我 们 利用 时 间 戳 计算 幻灯 睛 持续 时 间 。 
种 转换 的 对 象 叫做 LogFileTransformer， 而 且 因 我 崇尚 测试 ， 我 会 为 之 写 一 些 测 试 。 代 码 清单 4.6 展 示 了 其 中 一 个 
尔 能 不 能 找到 罪魁 祸首 。 


‘Bb 


负责 这 
一 一 它 受 到 过 度 


新 言 的 折磨 一 以 及 相应 的 安 疼 (setup) 。 看 一 看 从 
变 得 脆弱 和 不 透明 


安仁 


代码 清单 4.6 ”过 度 断 言 使 测试 


public class LogFileTransformerTest 1 
private String expectedoutput.; 
Drivate String loogFile: 

{ 


Berfore 
public void setUpBuildLogFilel() 
neWw StringBuilder!():; 
LAUNCHED"): 
号 S91On-1 忆 ###SID"):; 


StringBuilder lines 
appendTo(llines, "[2005-05-23 21:20:33] 
appendTo (lines, "[2005-05-23 21:20:33] 


appendTo (lines, "[2005-05-—23 21:20:33] User—id###UID"}:; 
appendTol(llines, "[2005-05-23 21:20:33] presentation-1iQd###EPID" 
appendTo(llines, "[2005-05-23 21:20:35] screenl"}); 
appendTo(lines, "[2005-05-23 21:20:36] screenz2"): 
appendTo (lines, "[2005-05-—23 21:21:36] screen3"):; 
appendTo (lines, "[2005-05-23 21:21:36] screend"): 
appendTo (lines, "[2005-05-23 21:22:00] screens")}).; 
appendTo (lines, "[2005-05-23 21:22:48] STOPPED").; 
loogqFile = lines.toString't).:; 

| 


Eefore 
DUublic vold setUpBulilldTransformedFilel(} 


StringBuilder file = new StringBuilder'():; 
appendTo (file, "sesslion—1dtt##SID"):; 

appendTo (file, "presentation-m-1id###PID"):; 
appendTo (file, "user-idi#itit#UID"):; 

appendTo (file, "started#t##2005-05-23 21:20:33"); 
appendTolfile, "screenl#i##1").; 

appendTo (file, "screen2t##60").; 


appendTo (file, "screen3###0").; 
appendTo (file, "screend#t##24"); 
appendTo (file, "screenSs###A48"). 
appendTo (file, "finishedt###2005-05-23 21:22:48"); 
expectedOutput = file.toStringt{)}); 
上 


Test 
Public vold transformationoceneratesRightstutftIntoTheRightFilel!l) 
throws Exception 1 

TempFlile input = TemrFile.withSsuffix(" .src.1og") .append(l]ogF1ilel).: 
TempFile output = TempFile.withSsuffix{(" .dest.logq"): 
new LogFileTransformer(}) .transform(input .file(})}, output.file({)) 
SsertTrue(l"Destination file was not created', output.exists(})).; 
dassertEquals lexpectedOQutput, output. contentl(}) 


// rest omitted for clarityvy 


言 一 一 但 哪个 是 罪 鬼 祸首， 什么 造成 它 如 此 被 滥用 呢 ? 





你 看 到 过 度 断 言 了 


第 一 个 断言 检查 目标 文件 是 否 创建 。 第 二 个 断言 检查 目标 文件 的 内 容 符 合 期 性 。 现 在 ， 第 一 个 断言 的 价值 值得 商检 ， 而 且 很 
可 能 需要 删除 。 但 我 们 主要 关注 第 二 个 断言 








assertEquals (expectedOutput, output.content()).; 


某 种 意义 上 说 ， 它 精确 地 验证 了 测试 名 称 所 上 暗示 的 内 容 ， 这 是 个 重要 的 断言 。 问 题 是 这 个 测试 太 宽泛 了 ， 导 致 断言 对 整个 日 
志文 件 进行 大 规模 比较 。 它 是 一 张 厚 厚 的 安全 网 ， 这 有田 无 疑问 ， 即 使 是 输出 中 最 微小 的 变化 也 会 使 断言 失败 。 也 正 是 这 里 存在 问 


日 
融 。 


永 不 失败 的 测试 没有 价值 一 一 它 可 能 没有 测试 任何 东西 。 而 在 男 一 个 极端 ， 忆 是 失败 的 测试 也 很 烦人 。 我 们 需要 的 是 一 个 
过 去 曾经 失败 的 测试 抓 住 与 被 测 代码 的 预期 行为 之 间 的 偏 夫 一 一 并 且 如 果 我 们 改动 被 测 代码 它 束 会 再 次 失败 。 


Lb 




















本 例 中 的 测试 太 容 易 失 败 而 变 得 脆弱 ， 因 此 没 能 满足 这 条 标准 。 但 那 只 是 更 基本 问题 新 言 的 问题 。 日 志 
件 格式 或 内 容 的 微小 变化 都 是 测试 失败 的 原因 。 断 言 并 无 本 质 错误 。 问 题 在 于 测试 违反 了 构成 优秀 测试 的 基本 指导 原则 。 





一 个 测试 应 该 只 有 一 个 失败 的 原因 。 


是 否 这 个 原则 看 起 来 有 眼熟， 其 实 它 是 著名 的 面向 对 象 设计 原则 的 变 体 ， 也 即 单一 职责 原则 (SRP) 所 说 的 “一 个 类 应 该 有 且 
只 有 一 个 改变 的 理由 ”。 上 现在 我 们 澄清 一 下 为 何 这 个 原则 如 此 重要 。 


捕获 到 输出 中 的 各 种 变化 还 是 不 错 的 。 但 是 当 测 试 失败 ， 我 们 想 知 道 原 因 。 本 例 中 ， 如 果 测 试 
transformationGeneratesRightstufflntoTheRightFile 突 然 失 败 ， 很 难说 清 友 生 了 什么 。 实 际 上 ， 我 们 总 是 不 得 不 查看 细 蔬 来 
找 出 是 什么 友 生 了 变化 并 破坏 了 测试 。 如 果断 言 太 过 宽泛 ， 那 么 许多 破坏 测试 的 细节 都 是 无 关 的 。 


我 们 应 该 如 何 改进 这 个 测试 ? 


4.2.2 ”该 对 它 做 点 儿 什 么 


当 我 们 碰 到 过 度 细节 的 过 度 断 言 ， 第 一 步行 动 是 识别 无 天 细节 并 将 其 从 测试 中 移 除 。 本 例 中 ， 你 会 得 看 要 转换 的 日 志文 件 ， 


尝试 减少 行 数 。 


我 们 希望 它 代 表 一 份 有 效 的 日 志文 件 ， 并 且 对 于 测试 目的 来 说 足够 详尽 。 例 如 ， 日 志文 件 具 有 对 五 个 屏幕 的 计时 。 也 许 两 三 
个 就 够 了 ? 我 们 能 否 只 用 一 个 ? 
这 个 问题 使 我 们 考虑 下 一 个 改进 : 拆 分 这 个 测试 。 


问 问 目 己 ， 当 不 再 测试 x、y 或 z 的 情况 下 ， 能 够 迅速 通过 测试 所 需 的 最 小 日 志文 件 要 多 少 行 。 这 里 x、y 或 z 都 是 可 以 单独 进行 
测试 的 主要 候选 者 。 代 码 清单 4.7 展 示 一 种 可 能 的 解决 方案 ， 将 日 志文 件 的 每 个 方面 及 其 转 损 都 抽取 到 单独 的 测试 。 


代码 清单 4.7 ”只 专注 于 一 个 方面 的 断言 是 可 读 的 、 丰 固 的 


public class LogFileTransformerTest 1{ 
private static final String END = "2005-=-05-=23 21:;:21:37".; 
private static final String START "00005-0323 1:20:33"; 


Drivate LogFile logFile.; 


Beiore 
PUublic void prepareLogFile() i 


LOgF1ile = new LOogF1ilelsTART, END): 档 查 公 共 立 性 半 
. ,正确 放置 
色 TEest < 
Public void overallFileStructureIsCorrect{() 
throws Exception 1 
StringBuilder expected = new StringBulldert(): 
appendTo (expected, "sgesslicon-1dt###SID"). 
appendTo (expected, "presentatlion-1id###PID"):; 
appendTo (expected, "user—id#8##UID"):; 
appendTo (expected, "started###¥#2005-05-23 21:20:33"): 
appendTo (expected, "finished#t#2005-05-=23 21:21]1:37"); 
ASSertEquals (expected.toSstring()}, transform(logFile.toString()})}):; 


} 

ee +] 检查 日 志 中 记录 

Public void screenDurationsGobBetweenstartedAndFinishedl) 屏幕 持续 时 间 的 

throws Exception { 位置 

logFile.addcContent{("[2005-05-23 2]:20:35] screenl"}.: ee 
String cut = transform(logFile.tostring(})}).:; 
assertTrue (out., 1ndexof ("started'}) < out, indexof ("screenl"))}):; 
assertTrueltout.indexoft("screenl") < out.indexof ("finished")).; 

| 

了 |] 检查 屏幕 持续 


Public void screenDurationshireRenderedInSseconds!{) Ne 
throws Exception 1 时 间 的 计算 

logFile.addcContent("[2005-05-23 21:20:35] screenl"}). 

logFile.addCcontent ("[2005=-05-23 21:20:35] screenz2"]); 

loogFile.addcCcontent{("[2005-05-23 2]:2] :36] screen3"); 

string output = transform(l]ooFile.toSsString{()).: 

assertTrue (output .contains ("screenl###0°")); 

assertTrue (output .contalns ("screen2##t#61")): 

assertTrue loutput .contains("screen3###1")).; 


} 


ff rest omitted for brevity 


private String transform(string log) { ... }]} 
private void appendTo (StringBuilder buffer, String string) { ... } 
Drivate class LoogFile { ... 1} 


这 个 万 案 引 入 测试 辅助 类 LogFile， 基 于 给 定 的 起 止 时 | 间 ， 为 待 转换 的 日 志文 件 建立 标准 信封 (envelope) 一 一 页 首 和 页 
尾 。 这 使 得 第 二 个 、 第 三 个 测试 ，DurationsGoBetweenStartedAndFinished 与 screenDurationsAreRenderedln， 只 需要 向 
日 志 添 加 屏幕 持续 时 | 间 ， 从 而 使 测试 更 专注 和 容易 掌握 。 换 句 话 说 ， 我 们 将 一 部 分 构造 完整 日 志文 件 的 责任 委派 到 LogFile 中 。 
为 了 确保 这 部 分 责任 得 到 落实 ， 整 个 文件 结构 由 第 一 个 测试 overallFileStructurelsCorrect 在 最 简单 场景 的 上 下 文中 来 验证 : 一 
个 在 其 他 方面 都 为 空 的 日 志文 件 。 


\ 一 一 


这 次 重 构 隐藏 了 与 每 个 特定 测试 无 天 的 细节 ， 使 其 更 加 专注 。 这 也 是 这 种 方法 的 缺点 些 细 巧 隐藏 起 来 。 运 用 这 种 技 
术 ， 你 必须 问 问 上 自己 什么 更 有 价值 : 是 能 够 一 多 众 山 小 ， 还 是 能 快速 地 看 到 某 个 测试 的 精髓 。 





大 多 数 谈 到 单元 测试 的 时 候 ， 我 建议 后 者 更 加 可 取 ， 作 为 细 粒 度 和 专注 的 测试 点 ， 一 旦 测试 失败 ， 你 可 以 快速 定位 到 问题 的 
根源 。 比 如 ， 所 有 测试 都 对 转换 后 的 整个 日 志文 件 进行 断言 ， 那 么 文件 语法 的 微小 改变 都 会 轻易 地 破坏 所 有 的 测试 ， 使 乙 更 难 定 
位 失败 原因 。 


4.2.3 ”小 结 
关心 整体 是 好 事 。 但 断言 过 于 泛 小， 就 会 搬 起 石头 砸 自己 的 脚 。 由 于 从 输出 结果 中 切 出 的 蛋糕 太 大 ， 再 加 上 按 位 比较 的 副 作 
用 ， 导 致 测试 变 得 脆弱 ， 因 此 过 度 断 言 是 有 害 的 。 任 何 小 细节 发 生变 化 ， 无 论 变 化 是 否 与 测试 目的 相关 ， 上 断言 都 会 失败 。 


过 度 断 言 还 使 程序 员 难 以 识别 测试 的 意图 和 精髓 。 当 你 看 到 似乎 胃口 很 大 的 测试 ， 问 问 你 目 己 到 底 想 验证 什么 ”然后 ， 试 着 
在 那些 方面 制定 断言 。 


我 们 所 使 用 的 术语 和 词汇 对 传达 意图 来 说 至 关 重 要 ， 但 我 们 正在 谈论 自动 化 测试 ， 因 此 ， 我 们 使 用 的 编程 语言 结构 也 值得 思 
考 。 正 如 我 们 的 下 一 个 测试 坏 味 道 所 指出 的 ， 不 是 所 有 的 编程 语言 结构 都 是 生来 平等 的 。 


[1] 《敏捷 软件 开发 : 原则 、 模 式 与 实践 》 (Apgile Software Development : Principles, Patterns, and Practices) , Robert CC. 


Martin,，2003。 


4.3 ” 按 位 断言 
本 章 开 始 时 我 描述 了 基本 断言 ， 因 为 它 的 抽象 层次 低 从 而 显得 如 此 模糊 ， 以 人 致 其 意图 和 意义 对 读者 来 说 是 个 恋 。 按 位 断言 是 
基本 断言 的 一 个 特殊 情况 ， 我 认为 它 值得 单独 一 提 。 因 为 它 的 元 素 触 及 许多 程序 员 的 痛处 ， 却 与 同样 很 多 的 程序 员 毫 无 瓜葛 。 


或 许 一 个 例子 有 助 于 具体 化 这 种 危害 。 


4.3.1 示例 


我 们 看 一 个 展示 了 这 种 特殊 的 坏 味 道 的 具体 例子 。 考 虑 一 下 代码 清单 4.8 中 的 测试 。 
代码 清单 4.8” 按 位 断言 ， 也 称 为 “这 个 运算 符 又 干 了 什么 ?” 


public class PlatformTest { 
GTest 
public void platformBitLength() ft 
assertTrue (Platform.IS 32 BIT ^ Platform.IS 64 BIT) ， 
} 


这 里 我 们 要 检查 什么 ”断言 包含 了 摘 述 ， 它 断言 两 个 布尔 值 的 “^ 位 运算 ”结果 为 真 。 位 运算 符 做 了 什么 ?什么 时 候 断 言 会 
失败 ? 


如 果 你 恰好 工作 在 一 个 相对 底层 的 领域 ,经常 与 位 运算 打交道 ， 你 会 很 快 推断 出 我 们 在 进行 一 次 XOR ( 异 或 ) 运算 ， 意味 
着 如 果 位 运算 符 两 边 的 布尔 值 相 同时 ， 断 言 丈 会 失败 。 


现在 我 们 清楚 这 个 测试 在 做 什么 了 ， 有 什么 问题 吗 ? 


位 运算 符 正 是 测试 的 问题 所 在 。 位 运算 符 是 用 于 位 和 字 节 运算 的 强大 语言 特性 。 但 在 这 个 测试 的 上 下 文中 ,我 们 并 非 处 于 位 
和 字 记 的 领域 。 我 们 处 于 “我 们 应 该 运行 在 32 位 或 64 位 染 构 ”的 领域 ， 而 精髓 隐藏 在 无 天 的 位 运算 竺 背后 。 


那个 特殊 的 位 运算 符 完 全 适合 去 有 效 地 执行 一 个 简洁 的 断言 ， 但 我 们 并 不 是 在 优化 测试 断言 。 我 要 确保 我 们 正确 地 构建 正确 
的 事情 一 一 我 们 的 代码 做 我 们 期 望 的 事情 ， 同 时 我 们 的 期 望 是 有 道理 的 。 出 于 这 个 目的 ， 必 然 有 一 个 更 好 的 方式 来 表达 我 们 的 


意图 ， 而 不 是 位 运算 符 。 


4.3.2 ”该 对 它 做 点 儿 什 么 


这 次 ， 解 决 万 案 很 简单 。 用 一 个 或 多 个 布尔 运算 符 来 蔡 损 位 运算 待 ， 清 晰 地 依次 表达 期 姓 。 代 码 清单 4.9 为 我 们 的 测试 示例 
展示 了 一 种 方式 。 


代码 清单 4.9 ”倾向 于 使 用 布尔 运算 符 ， 而 不 是 位 运算 竺 


public class PlatformTest { 
GTest 
public void platformBitLength() { 
assertTrue("Not 32 or 64-bit platform?", 
plattorm, LS :32 .BIT || Plabtfomm.TS 0d .BIT 
assertFalse("Can’t be 32 and 64-bit at the same time.", 
Platftorm Is 32 BIT kk Platform: Is bd BIT):s 


是 的 ， 它 更 加 宛 长， 但 断言 的 表述 也 更 加 明确 。 在 这 种 情况 下 ， 纯 英文 消息 非常 有 助 于 理解 ， 而 且 用 两 个 简单 的 布尔 运算 符 
蔡 换 一 个 位 运算 符 的 做 法 ， 会 使 没有 戴 二 进 制 手表 [的 程序 员 更 加 容易 理解 逻辑 。 折 


4.3.3 ”小 结 


正如 其 他 种 类 的 基本 断言 ， 按 位 断言 显示 出 同样 的 问题 : 难以 理解 它们 的 意思 ， 我 们 可 怜 的 大 脑 不 得 不 拼命 弄 清楚 状况 。 位 
运算 符 是 强大 的 语言 结构 ， 以 及 许多 应 用 领域 所 必 不 可 少 的 。 但 是 ， 当 用 位 运算 符 去 简化 表达 并 非 与 位 直接 相关 的 逻辑 时 ， 我 们 
束 路 上 了 一 个 下 降 螺 旋 。 把 位 运算 符 留 给 位 运算 ， 尽量 用 属于 适当 抽 缚 层次 的 语言 来 表达 高 层 概念 。 


[1] 只 有 少 部 分 极 客 (geek) 才 会 戴 二 进 制 手 表 ， 作 者 上 暗喻 并 非 所 有 人 都 喜欢 二 进 制 位 操作 ， 大 多 数 程 序 员 还 是 会 感觉 位 运算 过 
于 精妙 因而 不 够 直观 。 译 者 注 

[2] 我 在 旅行 时 已 经 分 不 清 时 区 了 ， 也 很 难 设置 阐 钟 ， 想 再 去 看 懂 二 进 制 手表 (binary watch) 的 时 间 显 示 就 更 难 了 ， 感 觉 戴 这 种 
表 就 是 极 客 的 书 采 子 行为 。 





4.4 ”附加 细 证 


代码 可 读 性 源 于 快速 和 忠实 地 回 读 者 揭示 意图 、 目 的 和 意义 。 当 程序 员 扫 视 一 段 代 码 ， 他 们 是 在 寻找 牛肉 ， 而 不 想 要 咨 汁 。 
有 时 我 们 的 测试 代码 宛 满 了 大 多 的 资 汁 。 我 们 称 这 种 坏 味道 为 附加 细 太 。 


让 我 们 再 次 看 一 个 例子 。 这 个 更 长 。 论 点 时 间 找 出 这 个 测试 到 底 想 验证 什么 。 
4.4.1 示例 


下 面 是 另 一 个 来 自 JRuby 项 目的 例子 。JRuby 有 个 模块 叫 ObjectSpace， 它 可 以 令 你 的 程序 访问 到 所 有 运行 期 生存 的 对 象 。 
例如 ， 你 可 以 遍历 肝 种 类 型 的 所 有 对 象 。 代 码 清单 4.10 的 代码 表示 了 Objectspace 的 一 个 测试 ， 用 于 确保 按 类 型 查找 的 代码 能 
单 工作 。 我 们 来 看 一 看 。 


代码 清单 4.10 ”这 个 测试 试图 把 牛肉 藏 起 来 ”你 能 迅速 说 出 它 做 什么 吗 ? 


public class TestObjectSpace 1{ 
Drivate Ruby runtime; 
private ObjectSpace objectSpace; 


Beiore 
public woid setUp{() throws Exception 1{ 
runtime = Rubvy.newInstancel():; 


objectSpace = new ObjectSpace!l).; 


@Test 
public void testObjectSpace() 1{ 
IRUubyObject ol = runtime.newFixnum!(10).; 
IRUuUbyObject o2 = runtime.newFixnuml(l20): 
IRUubyObject 063 = runtime.newFixnuml(30):; 
TRUubyObjJect od4 = runtime.newSstring("hello"); 
objectSpace.add (ol): 
objectSpace.add (o2):; 
objectSpace.add(o3):; 
obhjectSspace.add (od4):; 
List storedFixnums = new ArrayList (3): 
storedFixnums .add (o1):; 
storedFixnums .add (02); 
storedFixnums .add (o3);} 
Iterator strings = objectSpace.iterator (runtime.getSstring()):; 
ASsSertSame (oOo4, strings .next ());} 
assertNull (strings.next()); 
Iterator numerics = objectSpace.iterator (runtime.getNumerict()); 


for (int 1 0; 1 < 3; 1++) { 
Object item = numerics.next!{)}).; 
assertTrue (storedFixnums .contailins (ltem)): 


了 
assertNull (numerics,next(}}): 


那么 我 们 在 测试 ObjectSpace 的 行为 ， 并 且 我 们 首先 向 其 中 “添加 ” 某 种 类 型 的 对 象 ， 然 后 请 求 访 类 型 的 迭代 器 
(lterator) ， 检 查 是 否 拿 回 了 那些 对 象 。 


找 出 这 个 简单 吧 ? 这 不 是 火箭 科学 ， 但 却 长 篇 大 论 地 表达 我 们 的 意图 。 人 脑 一 次 整 只 能 应 付 这 么 多 概念 ， 而 跟踪 所 有 那些 列 
表 和 和 运 代 器 融 实 在 太 多 了 。 同 时 ， 断 言 本 身 散 发 着 基本 断言 的 臭 味 。 


4.4.2 ”该 对 它 做 点 儿 什 么 


当 牛 肉 被 隐藏 起 来 时 ， 你 需要 找 出 它 。 测 试 的 本 质 应 当 是 开门 见 山 ， 这 可 以 归结 为 几 个 信 单 的 准则 : 


1. 将 不 必要 的 安 丢 (setup) 抽取 到 私有 方法 或 安装 部 分 。 
2. 起 个 恰当 的 、 摘 述 性 的 名 字 。 


3. 一 个 方法 内 尽量 只 有 一 个 抽象 层次 。 


我 们 看 看 如 何 将 这 些 准 则 运用 到 示例 上 。 


首先 ， 我 们 改 为 在 安装 方法 中 创建 那 4 个 对 象 ， 将 局 部 变量 转 为 测试 类 的 字段 。 上 毕竟 ， 它 们 只 是 测试 的 道具 。 其 次 ， 由 于 测 
试 对 两 类 对 象 区 别 对 待 一 一 无 论 是 “Fixnums” 还 是 “Strings” 一 一 我 们 应 当 照 此 命名 以 凸显 类 型 。 代 码 清单 4.11 展 示 了 一 种 
方式 。 





代码 清单 4.11 命名 测试 中 的 对 象 ， 使 夹具 更 容易 理解 
public class TestObjectSpace { 


private IRUubyObject string:; 
private List<IRUbyObject> fixnums; 


QBefore 
public void setUp() throws Exception { 
Strindo = TUuntime.newString("hello"): 


fixnums = new ArrayList<IRuUubyObject>() {t{t 
add (runtime.newFixnum(10)).,， 
add (runtime.newFixnum(20)); 
add (runtime.newFixnum(30)); 


上 全 


现在 我 们 将 重点 移 到 测试 方法 本 身 ， 以 及 第 三 条 准则 : 一 个 方法 内 尽量 只 有 一 个 抽象 层次 。 说 到 抽象 ， 在 这 个 测试 中 我 们 天 
心 的 是 ,一旦 我 们 向 ObjectSpace 中 添加 了 某 些 对 象 ， 可 以 精确 地 通过 各 自 的 迭代 器 找到 那些 对 象 。 代 码 清单 4.12 中 显示 了 可 读 
性 万 面 的 明显 改进 ， 仪 仪 提 供 蛙 一 的 抽象 层次 。 


代码 清单 4.12 ”我 们 的 测试 万 法 现在 只 有 一 个 抽象 层次 


Dublic class TestObjectSspace 1 
private Ruby runtime; 
Drivate ObjectSpace space: 
Drivate IRuUubyObiject string: 
private List<IRUbPyObject> fixnums; 


间 BEFGOre 
public void setUp() throws Exception + 
ruUuntime = Ruby.newInstancel(): 


space = new ObjectSspace()}.; 

string = runtime.,newstring("hello").:; 在 测试 的 安装 中 
> ; | 性 济 人 HI 冯 当 车 
f1ixnums new ArravbList<IRUuUbyObJect>{} 1{{ $ 考 


,创建 夹具 对 象 


add {runtime.newFixnum(10)).: 


第 a 


add (runtime.newFixnum{(20)): 





add (runtime .newFixnum(30})):; 在 测试 的 安装 中 

] 创建 亦 具 对 象 

Test 

public void testobjectSpace(} { 
addTo {space, string):; 杜 充 
addTo (space, fixnums).; ObjectSspace 
Iterator strings = Space.iterator (runtime.getSstring()}): 2 
assertContainsExactly (strings, strind).:; 恰 查 

ObjectSspace 

Iterator numerics = space.literatorlruntime.cgetNumeric!()).:; 的 内 容 
ASSertContainsExactly (numerics, fixnums): 

} 


private vold addTo (ObjectSpace Space, Object... values) { } 
private voild addTo (ObjectSpace space, List values) { } 


private void assertcContainsExactly(Iterator 1, Object.,.,. values)} { } 
private vold assertcContainsExactly(Iterator 1, List values) { } 


这 已 经 好 很 多 了 ; 随 着 所 有 安 半 和 细 芒 从 测试 方法 本 身 移出 去 ， 牛 肉 显 露 了 出 来 。 另 外 ， 你 也 可 以 试看 给 夹具 对 象 起 个 更 具 
描述 性 的 名 字 ， 而 不 必 将 它们 移 到 安装 方法 ， 看 看 那样 是 否 已 经 足够 修复 附加 细节 的 坏 味 道 。 毕 竟 ， 只 有 一 个 测试 用 到 那些 夹具 
对 象 。 


无 论 如 何 ， 一 旦 你 发 现 附加 细节 ， 你 仍 需 处 理 剩 下 的 人 格 分裂 〈 见 4.5 节 ) 坏 味道 ， 以 及 鉴 脚 的 测试 名 字 。 我 们 将 这 个 作为 
练习 留 个 读者 。 
4.4.3 ”小 结 

当 你 写 完 一 个 测试 ， 退 后 一 步 ， 然 后 问 自己 : “测试 的 内 容 是 否 完全 清楚 和 明显 ? ”如 果 你 富 不 犹豫 地 说 是 ， 你 就 还 没完 
成 。 

牛肉 就 在 那里 ， 但 它 碎 落 在 测试 代码 中 。 更 具 描述 性 的 类 、 方 法 、 字 段 和 变量 名 字 有 助 于 强调 测试 的 意义 ， 但 还 远 远 不 够 。 


要 恰当 地 补救 这 种 情况 ， 你 应 该 寻求 将 不 必要 的 代码 和 信息 提取 到 私有 的 辅助 和 安 六 方法 中 。 一 个 特别 有 用 的 想法 是 尝试 在 测试 
方法 中 保持 单一 抽象 层次 ， 那 样 会 产生 更 具 摘 述 性 的 名 字 和 昭然 名 揭 的 测试 过 程 ， 正 如 给 牛肉 放 上 恰到好处 的 次 汁 。 


4.5 ”人格 分 裂 


改进 测试 的 一 个 最 简单 的 方法 是 找 出 我 称 为 人 格 分 裂 (split personality) 的 情况 。 当 测试 显现 出 人 格 分 裂 时 ， 它 认为 它 本 
身体 现 了 多 个 测试 。 那 是 不 对 的 。 一 个 测试 应 当 仅 检 查 一 件 事 并 妥善 执行 。["] 


又 该 看 个 例子 了 。 
4.5.1 示例 


代码 清单 4.13 中 的 测试 类 针对 一 些 命令 行 接口 。 它 其 实 是 用 不 同 的 命令 行 参 数 来 测试 Configuration 对 稼 的 行为 。 我 们 看 一 
看 。 


代码 清单 4.13 ”测试 对 命令 行 参 数 的 解析 


DabplLLe' class TestConfigquration 1{ 


GTest 
public void testParsingCommandLineArguments() { 
Stringl] args = { ™f", "hello.txt", "=v", “==ersgion" }:; 
Configuration c = new Configuration().; 
CcC.processArguments (args); 
assertEquals ("hello.txt", c.getFileName()).， 


assertFalse(c.isDebuggingEnabled()); 
assertFalse(c.isWarningsEnabled()).， 
assertTrue(c.1isVerbose()); 
assertTrue(c.shouldShowVersion()); 


C = Tew Confligurationl(); 

ER 4 
Cc.processArguments (new String[] {"-f"}); 
fail("Should've falledq" ) ; 

} catch (InvalidArgumentException expected) { 
// this is okay and expected 

} 


这 个 测试 的 多 重 人 格 体现 在 它 涉及 了 文件 名 、 调 试 、 和 敬告、 信息 开关 、 版 本 号 显示 ， 还 处 理 了 空 的 命令 行 参数 列表 。 注 意 这 
个 测试 没有 遵循 你 在 3.3.2 节 学 到 的 准备 -执行 -断言 结构 。 


很 明显 这 里 我 们 断言 了 许多 东西 。 虽 然 它 们 全 都 与 解析 命令 行 参数 有 关 ， 但 还 是 可 以 彼此 隔离 。 
4.5.2 ”该 对 它 做 点 儿 什 么 


这 个 测试 的 主要 问题 在 于 它 胃 口 太 大 ， 我 们 将 开始 着 手 解决 。 这 里 还 存在 一 些 重复 ， 我 们 也 会 解决 。 我 们 先 排除 这 些 干 扰 ， 
这 样 残 可 以 看 清 主 要 问题 。 


测试 在 多 处 用 默认 构造 器 实例 化 Configuration。 我 们 可 以 将 c 变 为 私有 字段 并 在 @Before 方 法 中 实例 化 它 ， 比 如 : 


public class TestConfiguration { 
private Configuration c; 


QBefore 

public void instantiateDefaultConfiguration() { 
CcC = new Configuration!(),; 

} 


去 掉 重 复 以 后 ， 我 们 剩 下 对 processArguments(0 的 两 次 不 同调 用 和 6 个 不 同 的 断言 (包括 try-catch-fail 模 式 ) 。 这 意味 着 
至 少 两 个 不 同 的 场景 一 两 个 不 同 的 测试 。 接 下 来 将 这 两 部 分 抽取 到 各 自 的 测试 方法 中 : 


public class TestConfiguration { 


@Test 
public void validArgumentsProvided() { 
String[] args = { "-f", "hello.txt", "-Vv", "--Vversion" }; 


CcC.processArguments (args).,， 

assertEquals ("hello.txt", c.getFileName()).; 
assertFalse(c.isDebuggingEnabled()).;， 
assertFalse(c.isWarningsEnabled()); 
assertTrue(c.isVerbose()); 
assertTrue(c.shouldShowVersion()).;， 


} 

GTest (expected = InvalidArgumentException.class) 

public void missingArgument() { 
Cc.processArguments (new String[] {"-f"}),; 

} 


将 粗 粒 度 的 场景 分 离 ， 也 残 更 加 容易 给 出 更 具 摘 述 性 的 测试 方法 名 。 你 要 是 问 我 的 话 ， 这 总 是 个 好 兆头 。 


我 们 还 在 半路 上 。 看 看 第 一 个 测试 的 断言 ， 你 会 看 到 一 些 检查 条 件 是 命令 行 参数 的 显然 结果 ， 而 一 些 则 是 隐 含 的 黑 认 值 。 为 
了 从 这 个 角度 有 所 改进 ， 我 们 将 测试 分 解 为 多 个 测试 类 ， 如 图 4.1 所 示 。 


AbstractConfig [estCase 


lestConfigurationErrors 





lestDefaultConfig Values| |lestExplicitlySetConfig Values 





图 4.1 三 个 具体 的 、 有 和 针对 性 的 测试 类 ， 它 们 从 抽象 基 类 继承 公共 的 安装 


这 次 重 构 意味 着 有 一 个 测试 类 关注 于 验证 正确 的 默认 值 ， 另 一 个 测试 类 验证 显 式 设 置 的 命令 行 值 能 正常 工作 ， 第 三 个 指出 应 
当 如 何 处 理 错 误 的 配置 值 。 变 化 体现 在 代码 清单 4.14 中 。 


代码 清单 4.14 ”将 分 胺 的 人 格 抽取 到 单独 的 测试 类 


public abstract class AbstractConfigTestCase { 
protected Confijguration ce:; 


@Before 
Bublic VOL linstantiateDefaultConfiguration() { 
c= new Configurationl().; 
C.DProcessArguments (args ()}): 
1 | 室 参 数列 表 的 
图 kh 人 情 
protected String[l] args() 人 < 就 了 月 


return new String[] { }:; 


} 


public class TestDefaultConfigValues 
extends AbstractConfigTestCase 1{ 

a@Test 

Public voild defaultoOptionshreSetCorrectly() 1 
assertFalsel(lc.,1lisDebugglingEnabledl()).; 
assertFalse (lc.,isWarningsEnabled()):; 
assertFalsel(lc.,1isVerbosel(})}): 
assertFalse(c.shouldSshowVersiont(}))}): 


| 
} 
public class TestExplijcitlySetConfigValues 特定 场景 
extends AbstractConfigTestCase 1{ 中 町 音 萄 
BOverride 世人 值 
protected String[] args() { < 
return new String[] {"-£f", "hello.txt", "-Yy", 
dr, "TW'', "~--Verslon"}.; 
上 
QTest 
public voild explicitOptlionsAreSetCorrectly{() { 
assertEquals("hello.txt", c.getFileName()):; 
assertTrue (lc.isDebuggingEnabled{()):; 
assertTrue(c.isWarningsEnabled!()): 
assertTruel(c.1isVerbosel)):; 
assertTruel(c.shouldshowvVversion!()); 
Public class TestConflilguratlilonErrors 特定 场景 
extends AbstractConfigTestCase { 中 覆盖 默 
@Override 认 值 
protected String[] args() { 局 


return new String[] "一 主 " 


BTeSst (expected = InvalidArgumentException.class) 
DUbBIicC Void missingArogumentRaisesAnError() { } 


这 次 重 构 的 收益 在 于 每 个 单独 的 测试 类 只 专注 于 一 件 事 。 代 码 变 多 了 ; 代 蔡 一 个 类 的 四 个 类 肯定 增加 了 代码 量 。 当 我 们 将 一 
个 测试 类 分 解 为 多 个 测试 方法 时 ， 代 码 的 相对 增加 量 会 大 大 减少 。 加 | 
无 论 引 入 继承 关系 的 权衡 是 否 值得 ， 所 增加 的 复杂 度 很 大 程度 上 取决 于 ， 具 体 测 试 类 是 否 从 基 类 中 共享 了 不 变 的 测试 。 如 果 


你 只 对 分 解 不 同 的 测试 方法 及 其 夹具 〈 而 它们 几乎 没有 什么 共享 ) 感 兴趣 ， 你 也 可 以 为 每 个 夹具 及 相 天 测试 建立 不 同 的 测试 类 ， 
避免 增加 类 继承 关系 的 复杂 度 和 伴 之 而 来 的 逻辑 分 割 (split logic) 坏 味道 。 


4.5.3 ”小 结 


可 读 的 代码 使 程序 员 明 晰 其 目的 。 人 格 分 裂 是 一 种 让 住 你 双眼 的 测试 坏 味 道 。 代 码 的 多 个 万 面 交织 在 一 个 测试 中 ， 测 试 的 细 
节 和 大 局 都 隐藏 起 来 ， 令 人 困惑 。 





将 测试 的 多 个 人 格 一 一 尼 的 多 个 兴趣 点 一 一 分 解 到 各 目的 类 中 ， 有 助 于 强调 测试 的 多 个 意图 ， 这 样 它们 丈 更 加 可 读 ， 而 且 
当 你 回来 修改 代码 时 处 境 会 更 轻松 ， 因 为 我 们 能 容易 地 看 到 代码 在 做 什么 ， 哪 些 场 景 遗漏 掉 了 。 换 句 话说 ， 你 会 了 解 你 所 不 了 解 
的 。 


另外 一 个 好 处 是 一 旦 你 犯错 (你 会 的 ) ， 你 能 更 加 精确 地 所 出 哪里 出 了 问题 ， 因 为 失败 的 测试 仅 覆 兰 了 一 小 部 分 情况 。 那 不 
再 是 “解析 配置 参数 时 出 了 问题 ”， 而 更 类 似 于 “多 值 的 配置 参数 不 能 与 单 值 配合 工作 ”。 

从 可 读 性 和 可 维护 性 来 说 ， 切 割 测试 类 及 方法 常常 是 巨大 的 改进 。 然 而 ， 切 割 会 走向 极端 。 这 时 ， 你 从 人 格 分 袭 完全 走 进 
了 逻辑 分 割 。 





[1] 注意 这 并 不 等 于 你 可 能 已 经 撞 到 的 “每 个 测试 一 个 断言 ”准则 你 还 可 以 用 多 个 断言 来 检查 一 件 事 ! 


已 
[2] 此外， 起码 我 读 一 本 厚 厚 的 英语 书 要 远 远 快 于 一 本 薄 薄 的 盖 尔 语 书 。 


4.6” 逻 查 分 割 


没 人 喜欢 阅读 长 篇 大 论 的 测试 。 一 部 分 原因 是 这 种 测试 几乎 都 展示 出 多 种 测试 坏 味道 ， 你 可 能 难以 确定 测试 到 底 在 干什么 ， 
以 及 它 本 来 的 意图 是 什么 。 人 们 不 喜欢 充满 好 几 屏 的 长 方法 ， 其 另 一 个 原因 是 ， 你 为 了 知晓 目前 的 状况 而 被 迫 在 源 文件 的 不 同 部 
分 来 回 切换 语 境 。 
简 言 之 ， 代 码 是 分 散 的 ， 需 要 额外 的 精力 去 寻找 ， 增 加 了 你 本 已 沉重 的 认 知 负担 。[ 
分 块 的 心理 学 
说 到 长 方法 ， 解 决 问题 的 明显 手段 就 是 将 其 切 成 小 块 。 原 来 ， 分 块 也 是 认 知 心理 学 的 一 个 基本 概念 。 


你 可 能 听 过 ， 有 人 说 记 住 一 个 像 326-3918 的 电话 号 码 比 记 住 同样 长 的 任意 数字 序列 如 3263918 更 加 容易 。 电话 号 码 更 容易 记 


忆 是 因为 我 们 将 其 分 成 两 个 短 序 列 ， 而 我 们 更 擅长 记 住 短 序列 包括 短 序 列 组 成 的 短 友 列 。 





这 可 以 解释 为 你 应 该 将 长 方法 分 解 为 短小 的 块 来 提高 代码 可 读 性 。 但 是 这 个 结论 下 得 太 快 了 。 分 块 对 我 们 管理 信息 的 能 力 具 


有 积极 影响 ， 小 块 不 见得 是 有 意义 的 ， 但 能 够 识别 小 块 的 意义 将 会 大 大 提高 效果 。14 
对 代码 来 说 ， 你 不 应 该 盲目 地 抽取 小 方法 ， 而 要 谨慎 考虑 ， 要 看 到 每 个 单独 方法 块 中 共享 有 有 意义 的 语句 系列 。 


信息 分 散 对 我 们 的 认 知 负担 是 有 害 的 ， 并 使 得 内 化 一 个 测试 的 意义 和 目的 变 得 更 慢 、 更 难 。 在 测试 代码 中 信息 分 散 的 更 糟 的 
例子 是 ， 在 被 测 领 域 中 普遍 地 引入 对 更 大 数据 块 的 操作 ， 而 非 针 对 偶然 的 float、int 或 名 为 firstName 的 String。 我 们 来 看 一 个 感 
染 了 分 散 症 的 真实 例子 。 


4.6.1 示例 


代码 清单 4.15 仍 然 来 目 优秀 的 JRuby 项 目 。 这 个 测试 检查 基本 的 运算 ， 例 如 ， 当 使 用 Ruby 类 运算 (eval) Ruby 代 码 时 ， 变 
量 赋值 和 方法 调用 能 正 弟 工 作 。 


代码 清单 4.15 ”逻辑 分 割 到 多 处 的 测试 是 难以 掌握 的 


public class TestRuby { 
private Ruby runtime; 


GBefore 

public vold setUp() throws Exception { 
runtime = Ruby.newInstance ( ) ; 

} 

@Test 


public void testVarAndMet () throws Exception { 
runtime.getLoadService() .init (new ee 
eval("load 'test/testVariableAndMethod.rb,' 
assertEquals ("Hello World", eval ("puts (sa) 
assertEquals ("dlroW olleH", eval ("puts S$b") 


assertEquals ("Hello World", 


eval ("puts S$d.reverse, S$cCc, Se.reverse")); 


assertEquals("135 20 3", 


eaveal ious OF VE Vas Wor Ve Vo 


这 不 是 个 长 方法 ， 但 展示 了 严重 的 信息 分 散 由 。 看 来 这 个 测试 方法 无 法 回答 为 什么 puts$b 会 返回 
从 这 个 源 文件 中 ， 我 们 错过 了 一 些 重要 信息 ， 因 为 它 分 散在 文件 系统 的 另 一 个 地 方 : 
件 。 切 换 到 那个 源 文件 ， 我 们 找到 完整 运算 序列 ， 如 代码 清单 4.16 所 示 。 


代码 清单 4.16 testVariableAndMethod.rb 包 含 了 一 堆 Ruby 代 码 


a = String.new("Hello World") 
b = a.reverse 
本 

Q = "Hello" .reVersSe 
e = al6, 5] .reverse 
上 = 100 + 35 

ys 10 

站 这 于 汪汪 

3- 造 

Sk 

$0 := 记 

8G 宇 记 

Se = e 

mr 丰 下 

$39 = 9 

Sh = 


回 逆序 的 “Hello World”? 
一 个 名 为 testVariableAndMethod.rb 的 文 


这 解释 了 测试 为 何 会 期 望 $a 到 $h 的 魔法 变量 同样 地 包含 魔法 数值 。 检 查 完 两 个 文件 并 来 回 一 两 次 ， 你 会 看 见 在 


现在 ， 你 怎样 才能 降低 这 种 严重 的 信息 分 散 ? 


4.6.2 ”该 对 它 做 点 儿 什 么 


testVariableAndMethod.rb 中 对 16 个 变量 进行 赋值 。 分 散 程 度 比 我 们 想象 的 还 要 糟糕 ， 原 因 在 于 那个 JUnit 测 试 只 表现 出 变量 
和 方法 ， 但 事实 上 它 也 在 测试 数学 运算 一 一 虽然 不 是 全 部 。 


单 ， 有 时 则 没 那么 容易 。 
inliningtestVariableAndMethod.rb 开 刀 ， 见 代码 清单 4.17。 


对 于 逻辑 分 割 来 况 ， 
我 们 看 看 将 这 种 方法 运用 到 代码 清单 4.15 和 代码 清单 4.16 中 的 情形 。 其 中 我 拿 


代码 清单 4.17 ”将 分 割 的 逻辑 内 联 到 测试 方法 中 


BTest 
public void testVarAndMet () throws Exception { 
runtime.getLoadService() .init (new ArrayList()).; 


AppendablerFile script = withTempFilel().,; 


最 简单 的 解决 方案 通常 是 内 联 外 部 的 信息 ， 将 所 有 代码 和 数据 都 移动 到 测试 中 来 使 用 。 有 时 这 极其 入 


script.line("a = String.new('Hello World')"); th 
script.line("b = a.reverse"); | 
script.line("c = ' '"); 

script.line("d = 'Hello' .reverse").; 

script.line(l"e = al[lé, S51] .reverse"),; 

script.line("f = 100 + 35") ; 

script.line("g = 2 * 10").; 

script.l]ine("h = 13 ®% 5°"): 

Script.line("sa = a").; 

script.l1ine("sb = b").; 

script.line("s$c = c"); 

script.line("sd = d"):; 

script.line("S$e = e").; 

script.l]ine("sf = £f").; 

SCript.line(t"sg = 可 ”) ; 

script.line("sh = 上") ; 


eval ("load '" 
assertEquals ("Hello World", 
assertEquals ("dlroW olleH", 


+ SCript .getAbsolutepath!l) 


十 0 
eval ("puts ($a)}")),; 


eval ("puts S$b")}):; 


assertEquals ("Hello World", 


evall"puts Sd.reverse, SSC, Se.reverse")); 
assertEquals("135 20 3", 
evalliTputs SE ME YT Sg VY VS hs 


有 操 儿 意思 。 将 分 散 的 信息 内 联 到 测试 方法 中 ， 以 去 除 逻 辑 分 割 的 问题 ， 


名 分 多 或 者 见长 安装 等 。 没 关系。 这些 坏 味道 正在 指引 我 们 的 万 同 。 


看 看 我 们 如 何 处 理 人 格 分 腔 ， 并 将 怪兽 般 的 测试 一 分 为 二 ， 如 代码 清单 4.18 所 示 。 


代码 清单 4.18 ”将 大 测试 分 解 为 多 个 具体 的 测试 


但 我 们 现在 开始 出 现 了 其 他 坏 味道 的 症状 ， 比 如 人 


apefore 

public void setUp() throws Exception { 
runtime.getLoadService() .init (new ArrayList()): 
script = withTemprilel(); 

} 

8&Test 

DUublic void variableAssignment() throws Exception 1 
script.l]ine("a = String.new('Hello')"); 
script.line("b = 'Worlgd'"}):; 
script.line("s$c = 1 + 2"); 
afterEvaluating (script). 
assertEgquals ("Hello", eval ("puts(a)" ))}).:; 
assertEquals ("World", eval ("puts b")): 
assertEquals("3", eval ("puts $c")); 

} 


aTest 

PUublic Vvoid methodInvocation() throws Exception { 
script.l1ine("a = 'Hello' .reverse"):; 
script.line("b = 'Hello'.length(})"); 
script.linet"c = ' BBC trim(' 3 "7 "YY"ys 
afterEvaluating (script):; 
assertEquals ("olleH", eval ("puts a")): 
assertEquals ("3", eval("puts b")); 
assertEgquals(" abc ", eval ("puts c")): 


} 


private vold afterEvaluating (AppendableFlile sourceFlile) 
throws Exception { 
eval ("load '" + SourceFile.getAbsolutePath() + "'").: 


这 样 修改 代码 看 起 来 还 不 赖 。 我 们 还 有 办 法 将 代码 清 蛙 4.18 中 的 两 个 测试 切 得 更 小 ， 使 其 更 加 专注 。 例 如 ， 期 望 结果 的 检查 
散 友 出 基本 断言 的 坏 味道 。 这 些 留待 将 来 再 说。 


何 时 内 联 数 据 或 逻辑 ? 
东 些 数据 和 还 辑 适合 内 联 ， 另 一 些 最 好 保持 独立 。 这 有 个 简单 的 局 发， 用 来 快速 判断 哪些 该 拉 进 测试 ， 哪 些 该 推 到 一 
1. 如 车 短小 ， 则 内 联 之 。 
2. 如 若 过 长 ， 则 将 其 藏 到 工厂 方法 或 测试 数据 构建 器 背后 。 
3. 如 若 不 便 ， 则 拉 进 单独 的 文件 。 


就 这 么 简单 。 最 好 是 能 够 将 测试 用 到 的 所 有 知识 都 放 在 测试 之 内 。 这 常会 导致 过 大 的 测试 ， 在 这 种 情况 下 ， 我 们 通常 将 极为 
接近 的 所 有 事物 都 放 入 测试 方法 中 ， 作 为 交换 ， 我 们 令 测 试 方法 调用 同 个 测试 类 中 的 辅助 方法 。 有 时 候 涉 及 的 数据 或 逻辑 太 复 
杂 ， 以 致 很 难 将 其 留 在 测试 类 中 。 此 时 ， 将 逻辑 或 数据 抽取 到 单独 的 数据 或 源 文件 中 更 有 意义 一 一 特别 是 如 果 多 个 测试 类 中 重复 
着 相同 的 数据 或 逻辑 。 


我 不 会 轻易 选择 外 部 数据 文件 。 同 时 阅读 两 个 文件 的 内 容 并 不 方便 甚至 不 可 能 ， 这 取决 于 你 采用 哪 种 编辑 器 和 IDE。IDE 对 
非 编 程 语言 文件 支持 程度 一 般 ， 也 就 说 不 大 支持 在 测试 代码 与 数据 文件 之 间 导 航 。 说 到 这 ， 当 我 最 终 选 择 外 部 数据 文件 时 ， 我 试 
着 遵循 一 些 准则 : 


- 修剪 出 必需 的 数据 一 一 刚好 能 代表 问题 中 的 场 最 。 尽 管 你 会 两 害 相 权 取 其 轻 而 选择 了 接受 信息 分 散 ， 但 你 最 好 保持 最 低 的 


额外 复杂 性 。 


` 将 数据 文件 与 使 用 它们 的 测试 放 在 同一 文件 夹 中 。 这 样 容 易 找到 数据 文件 ， 以 及 与 测试 代码 一 起 移动 。 (另外 ， 你 可 以 利 
用 Java 的 class path 来 加 载 ， 而 不 用 从 其 他 路 径 下 读 取 文件 。) 在 5.4 节 中 会 继续 讨论 这 个 方法 。 


-无论 你 最 终 选 择 哪 种 结构 ， 都 要 让 团队 党 得 方便 ， 并 坚持 下 去 。 你 会 使 大 家 的 生活 更 加 幸福 。 


考虑 从 class path 而 非 文件 路 径 来 查找 外 部 资源 ; 当 把 测试 代码 和 数据 文件 移动 到 另 一 个 包 时 ， 你 无 需 编 辑 测试 。 如 果 你 决定 
这 样 做 ， 最 好 确保 你 的 测试 数据 文件 具有 唯一 命名 ， 人 避免 令 人 讨厌 的 惊喜 。 


4.6.3 ”小结 


不 久 以 前 ,程序 员 们 学 到 的 是 源 代码 应 该 换行 ， 这 样 行 客 束 不 会 超过 80 个 字符 。 同 样 地 ， 我 们 也 学 到 立 数 不 应 该 超过 25 
行 。 虽 然 精 确 数 字 稍 和 有 区别， 但 这 些 规 则 背后 的 想法 都 基于 一 个 入 单 的 事实 ， 即 屏幕 有 限 ， 很 长 一 段 时 间 内 ， 人 们 的 显示 器 都 是 
每 行 只 能 容纳 大 约 80 个 字符 ， 每 屏 25 行 。 超 过 的 部 分 需要 滚动 才能 看 到 。 


虽然 当今 的 显示 器 可 以 容纳 更 多 像素 ， 首 选 的 函数 最 大 尺寸 也 在 改变 由 ， 但 不 在 代码 基 的 多 个 部 分 之 间 导 航 依 然 重要 。 逻 辑 
分 割 的 坏 味道 提醒 我 们 ， 避 免 不 必 要 地 将 测试 的 逻辑 与 数据 分 离 到 多 个 地 方 ， 特 别 是 多 个 源 文 件 。 


虽然 有 时 将 逻辑 或 数据 分 离 到 单独 文件 中 是 有 意义 的 ， 但 头号 原则 还 是 先 设 法 将 逻辑 或 数据 内 联 到 测试 中 ， 如 果 不 能 工作 ， 
设法 将 其 保留 在 测试 类 中 。 接 受 逻 辑 分 割 应 当 是 最 后 一 招 而 非 默 认 实 践 。 


逻辑 分 割 未 必 是 最 常见 的 测试 坏 味道 ， 下 个 坏 味道 绝对 是 最 普遍 的 之 一 ， 尽 管 大 多 数 程序 员 在 职业 生涯 早期 都 学 过 要 避免 


my 


比 。 


[1 认 知 超 负 荷 是 程序 员 特 别 第 见 的 问题 ， 因 为 编程 本 质 上 是 繁重 的 记忆 力 活 动 。 

[2] Applying Cognitive Load Theory to Computet Science Education, Dale Shaffer, Wendy Doube, Juhani-Tuovinen, Proceedings of First 
Joint Conference of EASE & PPIG, 2003. Psychology of Programming Interest Group, http://www.ppig.org/papers/15th-shaffer.pdf. 

[3] 它 也 展示 了 严重 的 人 格 分 裂 ， 但 我 们 现在 先 不 去 想 那 件 事 。 


[4 个 人 更 喜欢 子 数 少 于 10 行 ， 而 真正 喜欢 的 毫 无 例外 是 少 于 5 行 的 代码 。 


4.7” 帮 去 数字 
有 几 件 事情 将 全 世界 的 程序 员 团 结 在 一 起 。 编 程 语言 和 设计 模式 是 其 中 的 正面 例子 。 我 们 也 几乎 都 认为 魔法 数字 是 不 好 的 且 
应 当 避 免 。 魔 法 数字 是 藤 入 到 赋值 、 方 法 调用 和 其 他 语句 的 数字 值 。 


字面 量 123.45 和 42 是 这 种 魔法 数字 的 主要 例子 。 魔 法 数字 是 不 好 的 ， 理 由 是 它们 不 能 揭示 意图 一 阅读 代码 时 你 需要 思考 
42 的 目的 是 什么 ? 为 什么 是 42 而 不 是 43? 考虑 到 这 一 点 ， 魔 法 数字 的 基本 问题 也 会 在 魔法 字符 串 中 找到 一 一 为 什么 字符 串 是 空 
的 ?这 到 搬 要 不 要 紧 ， 或 者 有 人 只 是 需要 一 个 任意 的 字符 串 ? 


对 待 魔法 数字 的 传统 建议 是 用 音量 或 变量 蔡 损 它们 ， 从 而 给 予 数字 更 加 想 要 表达 的 意思 ， 使 代码 更 容易 阅读 。 但 那 不 是 唯一 
的 选择 。 我 们 看 一 个 充 奈 着 魔法 数字 的 例子 ， 以 及 如 何 令 人 惊喜 地 来 修复 问题 。 


4.7.1 示例 


Philip Schwarz 在 其 评论 Jeff Langr 的 博客 文章 1 中 介绍 了 他 会 为 保龄球 游戏 对 象 写 出 如 代码 清单 4.19 所 示 的 测试 。 


代码 清单 4.19 “为 什么 roll (10，12) 会 产生 300 分 ? 


public class BowlingGameTest { 


GTest 
public void perfectGame() throws Exception { 
Wo LE Lal // magic 
assertThat (game.score(), is(equalTo(300))); // numbers 
} 


这 个 测试 值得 研究 ， 因 为 它 将 魔法 数字 不 加 解释 地 传 入 被 测 代 码 。 当 你 写 测试 的 时 候 它 可 能 是 显而易见 的 ， 但 10 和 12 的 意 
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思 ， 以 及 为 什么 输入 会 产生 300， 这 样 并 不 完全 明显 。 当 你 在 几 个 星期 之 后 回 看 这 段 代码 ， 它 对 你 也 不 再 明显 了 。 
4.7.2 ”该 对 它 做 点 儿 什 么 


要 改善 这 个 测试 ，Philip 通 过 给 每 个 数字 起 名 来 引用 魔法 数字 ， 明 确 它们 的 意思 和 关系 。 就 像 我 说 的 ，Philip 这 人 么 做 令 人 惊 
讶 。 代 码 清单 4.20 展 示 了 他 是 怎么 做 的 。 


代码 清单 4.20” 啊 哈 ! 12 次 撞 倒 所 有 的 10 个 保龄球 瓶 产 生 了 300 分 


public class BowlingGameTest { 


GTest 
public void perfectGame() throws Exception { 
roll(pins(10}, times(12})}; 
assertThat (game.score(), is(equalTo(300))); 
} 


private int pins(int n) { return n; } 
private int times(int n) { return n; } 


尽管 更 为 弟 见 的 是 程序 员 用 静态 常量 或 本 地 变量 来 引用 魔法 数字 ， 但 在 代码 清单 4.20 中 Philip 在 测试 中 展示 的 万 法 具有 一 定 
的 优势 ， 某 些 情 况 下 你 可 能 会 采用 。 例 如 ， 在 代码 清单 4.19 中 ， 如 果 我 们 使 用 常量 来 命名 魔法 数字 ， 我 们 看 到 的 束 是 这 样 的 : 


roll (TEN_PINS, TWELWE_TIMES).; 


这 会 变 得 明显 和 可 读 一 一 比 在 代码 清单 4.20 中 的 pins (10) 和 times (12) 更 加 可 读 。 基 于 方法 的 优势 在 于 ， 当 你 有 好 几 个 





测试 一 一 这 很 常见 一 一 而 pins 和 rolls 的 数字 却 不 相同 。 你 肯定 不 希望 每 个 测试 中 都 存在 单独 的 常量 。 上 | 
4.7.3 ”小 结 

魔法 数字 是 代码 中 的 无 法 表达 自身 意图 的 数值 。 魔 法 数字 缺乏 明确 的 命名 或 解释 ， 使 你 无 助 地 猜测 数字 的 来 历 ， 以 及 为 什么 
会 是 那样 一 个 精确 的 数字 。 简 言 之 ， 你 应 该 避免 魔法 数字 ， 因 为 它们 会 像 大 卫 . 科 波 菲 尔 的 魔术 一 样 神奇 。 


用 具有 表现 力 名 字 的 本 地 变量 或 常量 蔡 换 魔法 数字 ， 是 引用 魔法 数字 并 使 之 明确 的 最 常见 万 式 。 代 码 清单 4.20 展 示 了 一 个 稍 
微 不 同 但 极其 有 用 的 技术 ， 用 来 记录 魔法 数字 的 意义 。 


程序 员 常 被 教育 说 ， 代 码 应 当 快 ， 精 简 胜 于 见 余 ， 这 往往 是 正确 的 说 法 。 但 有 时 我 们 对 可 读 性 的 需要 胜 过 简明 性 。 更 多 时 
候 ， 令 意图 明确 的 额外 一 两 行 代码 是 值得 的 。 那 正 是 在 代码 清单 4.20 中 提 到 的 Philip 的 pins0 和 times()。 


有 时 ， 我 们 似乎 都 乏 记 了 简洁 的 好 处 ， 最 后 真 的 在 测试 中 写 起 了 小 说。 有 时 ， 我 们 友 现 这 泽 文 学 作品 已 经 活跃 在 测试 安 委 


中 |! 


[1] 见 Jeff Langr 的 博客 “ Goofy TDD Construct ” ，2010 年 3 月 25 日 ，http://langrsoft.com/jeff/2010/03/goofy-tdd-construct/。 
[2] 其 他 编程 语言 (例如 Ruby) 支持 按 变 量 名 称 来 赋值 参数 ， 这 就 可 以 用 来 形成 相似 的 优势 。 


4.8 ”元 长 安装 
在 4.4 节 中 ， 你 学 到 了 附加 细节 ， 以 及 测试 该 如 何 快速 、 及 时 地 揭示 其 意图 、 目 标 和 意义 。 通 常 我 们 应 付 这 种 问题 的 办 法 


是 ， 将 无 天 细 书 抽取 到 辅助 方法 ， 只 在 测试 方法 中 留 下 关键 部 位 一 一 牛肉 一 一 使 其 开门 见 山 。 有 了 时 我 们 将 一 大 块 用 来 准备 测试 
场景 的 代码 移动 到 安 委 方法 中 。 





我 们 轧 晤 地 假设 ， 不 需要 像 生 产 代码 那样 专业 地 对 竺 测试 代码 ， 然 而 当 在 安装 万 法 中 友 现 次 乱 的 代码 时 ， 我 会 错误 地 认为 它 


“会 造成 翡 催 的 问题 。 


我 们 看 一 个 例子 ， 用 具体 的 术语 说 明 这 个 问题 。 


4.8.1 示例 


下 面 的 例子 是 我 几 年 前 写 的 代码 。 它 测试 一 个 对 象 ， 负 责 下 载 “ 幻 灯 片 。， 幻 灯 片 列 在 XML 代 码 清单 (manifest) 中 , 且 
不 存储 于 本 地 。 看 看 代码 清单 421， 看 它 是 否 符合 这 个 测试 坏 味道 的 名 字 。 


代码 清单 4.21 ”兄长 安装 指 用 于 简单 测试 的 漫长 安装 


PUublic class PackageFetcherTest 1 
Drivate PackageFetcher fetcher: 
private Map downloads.:; 
prlivate Flle tempD1ir; 


a@Before 

Public voild setUp() throws Exceptlion 1 
string svstemTempDlr = System.getPropertyl("Java.1o.tmmdlir").; 
tempDir = new Flile(systemTempDir, "downloads").,; 
tempDir.mkdirs():; 
string filename = "/manifest.xml"; 
InputStream ml = getClass(})} .getResourcehsStreamlfil]lename): 
Document manilfest = XOM.PpParse(IO.streamisstring (xml))}:; 
PresentatlionList presentatlions = new PresentationLlist'().; 
presentations.parse (manifest ,getRootE]ement () ) ; 


PresentationStorage db = new PresentationSstoragel()}):; 
List Jist = presentations .getResourcesMissingFroml(null, db):; 
fetcher = new PackageFetcher (): 
downljoads = fetcher.extractDownloads (1]1ist):; 
dAIfter 


public void tearDown{() throws Exception { 
IO.delete(ltempDir):; 
} 


@Test 

public void downloadsAllResources!({) { 
fetcher.download(downloads, temoDir, new MockConnector(}))}): 
assertEquals{(4, tempDir.l1ist() .length). 


哇 。 发 生 了 好 多 事 ， 包 括 一 个 逻辑 分 割 的 案例 和 一 个 不 大 理想 的 设计 [ 川 。 先 不 管 那些 ， 专 注 于 如 此 漫长 和 复杂 安装 的 症状 ， 
问题 是 复杂 的 安装 是 测试 不 可 或 缺 的 部 分 一 一 测试 本 身 相 当 简 单一 一 却 使 测试 相当 复杂 。 我 们 有 时 说 到 夹具 的 概念 ， 它 是 测试 
执行 时 所 处 的 上 下 文 ， 包 括 系 统 属性 、 定 义 在 测试 类 中 的 常量 ， 以 及 在 测试 类 层次 结构 中 @BeforeClass 和 @Before 安 装 方法 中 
初始 化 的 私有 成 员 。 为 了 理解 一 个 测试 ， 你 需要 理解 它 的 夹具 ; 安装 通常 是 夹具 的 关键 部 分 ， 用 于 创建 特定 对 象 及 测试 的 运行 状 





/Po 


4.8.2 该 对 它 做 点 儿 什 么 


尽管 我 提出 将 元 长 安装 作为 第 一 类 的 测试 坏 味道 ， 但 它 实 际 上 是 附加 细节 的 特例 。 当 面 对 元 长 安装 时 ， 我 们 宫 不 奇怪 地 依靠 
同样 的 一 些 技 术 。 具 体 来 说 ， 我 们 : 


1. 从 安装 中 抽取 无 天 细节 ， 放 入 私有 方法 
2. 给 予 适 当 的 、 摘 述 性 的 命 

3. 企 安 委 中 争取 做 到 同一 抽象 层次 

这 个 代码 清单 展示 了 如 何 进 行 这 几 步 。 


代码 清单 4.22 ”抽取 细节 ， 使 安装 更 容易 掌握 


public class PackagerFretcherTest { 
private PackageFetcher fetcher:; 
private Map downloads; 
private File tempDir; 


B&Before 
public void setUp() throws Exception { 
fetcher = new PackageFetcher!().; 
tempDir = createTempDir("downloads").:; 
downloads = extractMissingDownloadsFrom("/manifest.xml"); 
} 
BAfter 


BPUublic vold tearDown() throws Exception ({ 
IO.delete (tempD1lir).:; 
} 


&Test 

BUublic vol9 downloadsAllResources() ({ 
fetcher.download(downloads, tempDir, new MockConnector{()),; 
assertEquals (4, tempD1ir.11ist() .length); 

} 


private Flle createTempD1ir (String name) ({ 
String systemTempD1ir = System.getProperty ("JjJava.1o.tmdir").; 
File dir = new File(lsystemTempDir, name); 
dir.mkdirs():; 
return 局; 


} 


private Map extractMlssingDownloadsFrom(String path) { 
PresentatlionStorage db = new PresentatlonStoragel(); 
PresentatlionList lJ]ist = createPresentatlionListFroml(path):; 


List downloads = list.getResourcesMissingFrom(null, db):; 
return fetcher.extractDownloads (downloads):; 
】 


Drivate PresentationList createPpresentationListFroml(Strindg path) 
throws Exception { 
presentationList list = new PresentationList!(); 
list.parse(lreadManifestFrom(path) .getRootEl]ement () ) : 
return list.; 


】 


private Document readManifestFroml(lString path) throws Exception { 
InputSstream ml = getClass() .getResourceAsSstreaml(path).; 
return XOM.parse (IO.streamAsSstring (xml)): 





如 你 所 见 ， 安 委 只 做 三 件 事 : 实例 化 PackageFetcher， 创 建 一 个 临时 目录 ， 从 manifest.xml 文 件 中 将 缺失 的 下 载 项 抽取 到 
一 个 Map 中 。 总 的 来 说 ， 我 们 现在 的 代码 绝对 行 数 更 多 了 ， 但 我 们 通过 分 解 逻 辑 步 骤 和 给 予 有 表现 力 的 命名 ， 由 此 获得 的 清晰 
是 值得 的 。 重 构 以 后 ， 安 装 方法 处 于 单一 的 抽象 层次 上 ， 更 容易 理解 。 如 果 我 们 想 细 究 ， 可 以 向 下 导航 到 私有 辅助 方法 ， 累 活 儿 
都 在 那里 。[ 


4.8.3 “小结 


安 冯 方 法 ， 无 论 它 们 用 @Before 还 是 @BeforeClass 注 解 ， 应 该 像 其 他 测试 代码 一 样 得 到 爱护 和 培育 。 安 六 形成 测试 夹具 的 
主要 部 分 ， 并 创建 测试 运行 的 上 下 文 。 不 理解 夹具 ， 你 其 实 没有 理解 测试 到 底 做 什么 。 因 此 ， 你 应 该 像 冲 击 测试 方 法 中 的 附加 细 


廿 一样 来 攻击 郊 长 安 妆 : 抽出 细节 ， 给 予 有 表现 力 的 俞 名 ， 争 取 将 安 丢 保持 在 单一 抽象 层次 ， 这 样 会 加 快 阅 读 并 容易 掌握 。 

需要 据 出 的 是 ， 有 时 安 委 会 指 癌 更 大 的 问题 。 有 时 当 我 们 友 现 一 个 复杂 的 安 丢 ， 要 解决 的 问题 不 是 测试 安 委 的 可 读 性 ， 而 是 
设计 有 问题 才 授 使 测试 做 了 这 么 多 事情 。 我 们 写 这 么 多 代码 ， 往 往 是 因为 我 们 过 早 地 做 了 不 完美 的 设计 决定 。 而 有 时 ， 我 们 仪 仪 
是 写 了 太 多 代码 ， 正 如 本 草 最 后 一 个 测试 坏 味 道 。 


[1] PackageFetcher 包揽 了 两 件 事 从 而 违反 了 SRP (单一 职 贡 原则 ) : 抽取 要 下 载 的 列表 和 进行 下 载 。 
[2] 有 时 这 些 辅助 方法 被 证 明 在 测试 代码 之 外 也 是 有 用 的 ， 并 设法 成 为 生产 代码 的 一 部 分 。 这 的 确 发 生 过 。 


4.9 ”过 分 保护 


运行 Java 代 码 时 ， 常 见 的 Bug 症 状 之 一 是 突然 出 现 NullPointerException 或 IndexOut-OfBoundsException， 这 是 由 于 方 
法 意外 地 收 到 空 指针 或 空 串 参数 。 软 件 程 序 员 已 经 如 此 习惯 碰 到 这 种 错误 消息 ， 于 是 他 们 开始 在 方法 的 前 面 增 加 守卫 语句 和 其 他 
空 值 检查 来 保护 自己 。[ 中 


程序 员 不 时 也 在 测试 代码 中 运用 这 个 防御 性 的 编程 策略 ,保护 测 试 免 于 以 NullPointer-Exception 而 失败 ， 而 是 让 测试 优 鸦 
地 以 华丽 措辞 的 断言 而 失败 。 咀 们 赶 崇 看 看 展示 这 种 失败 模式 的 例子 吧 。 


4.9.1 示例 


代码 清单 4.23 展 示 了 一 个 简单 的 测试 ， 用 两 个 断言 来 验证 正确 的 计算 : 一 个 验证 从 getData() 方 法 返回 的 Data 对 象 不 为 空 ， 
另 一 个 验证 实际 的 计数 是 正确 的 。 


代码 清单 4.23 ”过 度 保护 的 测试 困扰 于 失败 ， 即 使 它 仍 然 会 失败 


@Test 

public void count() { 
Data data = project.getData().; 
assertNotNull (data).; 
assertEquals(4, data.count()).; 


这 是 过 度 保护 的 测试 ， 因 为 assertNotNull 是 多 余 的 。 在 调用 方法 之 前 ,检查 data 不 为 室 (如 果 为 空 ， 测 试 殊 失 败 ) ， 这 样 
测试 受到 了 过 度 保护 。 这 是 因为 当 data 为 空 时 ,测试 仍 会 失败 ;， 当 第 二 个 断言 试图 调用 data 上 的 count0 时 ， 测 试 会 不 驻地 以 
NullPointerException 而 失败 。 


4.9.2 ”该 对 它 做 点 儿 什 么 


删除 元 余 的 断言 。 它 基本 上 是 不 能 提供 附加 价值 的 废物 。 


当 问 起 程序 员 ， 是 谁 写 了 那 两 个 断言 ， 为 什么 觉得 需要 检查 空 值 ， 几 乎 他 们 总 是 引述 容易 调试 作为 主要 动机 。 他 们 的 想 ; 
是 ， 当 革 天 Data 对 象 确实 返回 空 时 ， 通 过 在 IDE 中 检查 失败 的 JUnit 测 试 的 栈 跟 踪 ， 就 更 加 容易 发 现 空 值 。 你 仅仅 双击 断言 ，1DE 
就 会 直接 将 你 带 到 测试 方法 ， 并 高 亮 assertNotNull 失 败 的 行 。 


这 种 想法 有 瑕 炉 ， 因 为 即使 没有 assertNotNull， 你 也 能 点 击 导 狼 NullPointerException 的 栈 跟 踪 ， 这 将 带 你 到 
assertEquals 对 于 空 引 用 报错 的 那 行 。 单 独 检 查 空 值 仪 有 的 真正 优势 在 于 ， 从 如 下 具有 方法 链 的 代码 行 抛 出 


NullPointerException 的 时 候 : 


asSsertEduals (4，qata.getSummary ( ) .getTotal () ) ; 


对 于 这 行 代码 ， 你 不 能 立即 判断 出 到 底 NullPointerException 是 因为 data 为 空 ， 还 是 summary 对 象 为 空 。 测 试 中 缺乏 明显 
的 检查 ， 你 必须 要 么 启动 调试 器 ， 单 步调 试 代码 来 看 哪个 对 象 为 空 ， 要 么 临时 地 增加 assertNotNull 并 重新 运行 测试 。 


当 碰 到 这 种 测试 失败 时 ， 我 个 人 更 愿意 承担 这 小 小 的 不 便 ， 而 不 是 在 每 次 阅读 测试 代码 时 忍受 一 个 废物 。 


4.9.3 小结 


过 分 保护 的 测试 充斥 着 见 余 的 断言 ， 来 检查 要 使 真正 的 断言 通过 所 需 的 中 间 条 件 。 这 种 元 余 断 言 没 有 提供 附加 值 ， 应 当 避 
免 。 测 试 仍 会 失败 ; 区 别 在 于 你 从 失败 的 测试 中 得 到 的 错误 消息 类 型 。 尽 管 一 般 对 程序 员 来 说 ， 明 确 是 件 好 事 ， 但 明确 的 无 关 细 


证 只 会 困扰 共事 的 程序 员 一 一 这 也 是 它们 被 称 为 附加 细节 的 原因 。 





[1] 明智 的 方式 是 ， 先 决定 空 值 参 数 是 否 应 该 作为 方法 各 约 的 一 部 分 一 一 解决 根本 原因 而 不 是 试图 修补 症状 。 


4.10” 忆 结 


本 章 我 们 研究 了 一 学 影响 测试 代码 可 读 性 的 坏 味道 。 源 于 糟 糙 和 混乱 断言 的 坏 味道 ， 是 我 们 开始 的 第 一 个 观察 。 基 本 断言 通 
过 过 于 底层 的 方式 来 检查 期 临 的 功能 ， 对 基本 对 和 象 的 比较 与 农 测 代码 的 抽象 层 次 相去 甚 远 。 过 度 断 言 要 求 得 太 多 一 一 以 臻 最 小 
的 细 芒 改动 都 会 中 断 测试 。 过 度 断 言 把 战线 拉 得 太 长 ， 打 算 验 证 的 具体 逻辑 残 淹 没 在 大 量 细节 乙 中 。 





位 断言 几乎 是 与 过 硫 断 言 相 反 ， 它 们 和 弟 单 极为 简洁 。 它 们 依靠 位 运算 符 来 表达 所 需 的 条 件 ， 问 题 是 并 非 所 有 程序 员 都 指 寿 位 
运算 符 吃 饭 。 这 东西 太 难 了 。 我 们 不 是 在 谈论 一 个 需要 博士 学 位 才能 解决 的 问题 ， 但 增加 的 认 知 负担 却 已 足以 打 断 程序 员 的 思 


VINS 


我 们 审查 的 一 些 坏 味道 阻止 程序 员 理 解 手 中 的 测试 。 附 加 细节 指 的 是 测试 的 精华 隐藏 在 混乱 和 无 天 的 细节 中 。 人 格 分 裂 将 多 
个 测试 缠绕 在 一 起 ， 检 查 各 个 方面 而 缺乏 清晰 的 焦点 ， 这 让 人 感到 困惑 。 逻 辑 分 割 将 逻辑 散布 到 多 个 文件 中 ， 使 得 测试 难于 把 
握 。 


魔法 数字 看 似 随意 地 散落 在 测试 代码 中 。 这 些 数 字 具 有 重要 意义 ， 但 测试 没有 将 其 明确 或 通过 命名 来 调用 ， 使 其 意义 不 明 。 
但 有 时 ,我 们 也 太 明 确 了 。 


见长 安装 是 特别 长 的 安 六 方法 ， 说 了 太 多 太 多 的 细 证 。 过 分 保护 的 测试 做 得 更 加 过 火 ， 明 显 地 断言 了 最 终 断 言 所 需 的 技术 前 
提 一 一 没有 说 明 哪 些 才 是 真正 需要 的 。 





所 有 这 些 坏 味道 都 是 编写 好 测试 时 的 常见 失败 模式 。 失 败 的 后 果 是 给 测试 的 可 读 性 市 来 不 同 的 障碍 ， 使 程序 员 难 以 理解 测试 
到 底 做 什么 及 天 键 点 。 阅 读 代 码 比 编写 代码 要 频繁 得 多 ， 理 解 代码 才 能 维护 它 。 


下 一 章 我 们 将 深入 更 多 的 测试 坏 味道 ， 具 体 与 可 维护 性 有 天。 


第 5 和 章 ” 可 维护 性 


本 章 内 容 包括 : 
: 增加 认 知 负担 的 测试 坏 味 道 
: 造成 维护 恒 梦 的 测试 坏 味道 
. 导致 十 怪 失败 的 测试 坏 味道 
在 本 章 中 ， 让 我 们 把 注意 力 从 测试 代码 的 可 读 性 转向 可 维护 性 。 


多 数 人 都 听 过 这 样 的 讽刺 ，“ 阅 读 代码 比 编写 代码 要 频繁 得 多 ”| ]。 这 种 现象 从 穿孔 卡片 时 期 延续 至 今 。 这 也 就 是 为 什么 可 
读 性 如 此 至 关 重要 。 当 我 们 不 仅仅 是 单纯 地 阅读 代码 ， 而 是 进入 编写 代码 的 世界 ， 更 多 时 候 “ 编 写 ” 真 正 意味 着 修改 或 扩展 遗留 
代码 。 有 时 我 们 叫 它 维护 而 有 时 又 叫 它 开 友 。 不 管 怎样 ， 忌 是 需要 改动 代码 。 


代码 与 生 俱 来 的 极其 灵活 又 极其 脆弱 的 特性 ， 使 得 它 非 党 迷人 ， 却 也 使 得 编程 这 项 技能 如 此 难以 擎 握 ， 根 源 束 在 于 代码 的 本 
质 : 极端 的 灵活 加 上 极端 的 脆弱 。 代 码 是 灵活 的 ， 因 为 很 少 有 事情 软件 不 能 完成 ， 它 没有 物理 上 的 限制 ;代码 又 是 脆弱 的 ， 因 为 
即使 是 最 小 的 改动 ， 仍 然 可 能 完全 月 演 。 代 码 从 不 慢 慢 退化 ， 而 是 直接 月 并。 


测试 也 是 如 此 ， 因 为 它 同 产品 代码 一 样 也 是 由 代码 组 成 的 ， 于 是 乎 同样 脆弱 。 程 序 员 编写 目 动 化 的 单元 测试 来 尽 可 能 地 管理 
这 种 脆弱 性 。 大 家 都 知道 维护 置 欧 是 什么 ， 你 绝对 不 希望 你 的 测试 代码 沦落 其 中 。 


吕 像 第 4 章 一 样 ， 本 章 也 由 一 系列 测试 坏 味道 构成 ， 其 中 每 个 测试 坏 味道 包括 示例 、 潜 在 的 解决 方案 或 改进 意见 。 我 们 会 从 
一 些 众 所 周知 的 、 增 加 测试 代码 维护 成 本 的 测试 坏 味道 开始 ， 然 后 进一步 讲 到 更 特殊 、 但 同样 会 危害 到 测试 代码 可 维护 性 的 坏 味 
道 。 首 先 ， 让 我 们 从 重复 谈 起 。 





[1] 源 自 《Windows 编程 启示 录 》 中 的 “Design for readability 一 节 ， 强 调 因 代码 被 读 到 的 机 会 更 多 ， 要 在 写 代 码 时 就 要 为 可 读 性 
做 好 设计 。 译 者 注 
5.1 重复 

在 一 个 大 型 行业 会 议 上 随便 抓 10 个 程序 员 ， 然 后 问 他 们 什么 是 万 恶 之 源 ， 我 敢 打赌 大 多 数 人 会 引用 高 德 纳 (Donald 


Knuth) 的 经 典 言论 : “过 早 优化 是 万 恶 之 源 ” (premature optimization being the root of all evil) 。(1 而 第 二 种 流行 的 答 
案 可 能 就 是 重复 (duplication) 了 一 一 假设 敏捷 软件 开发 人 员 、 被 测试 感染 (test-infected) [的 程序 员 和 软件 工匠 


(software craftsmen) 都 是 你 所 参加 会 议 的 常客 ， 而 他 们 强烈 关注 整洁 的 代码 (clean code) 外 。 


那么 什么 是 重复 ? 它 对 我 们 意味 着 什么 ? 简单 地 说 ， 重 复 是 存在 多 份 拷 贝 或 对 单一 概念 的 多 次 表达 一 一 这 都 是 不 必要 的 重 


最 明显 的 重复 也 许 丈 是 某 一 个 数字 值 或 子 符 串 在 代码 中 反复 出 现 。 有 了 时 重复 不 仪 存在 于 散 藻 各 处 的 硬 编码 中 ， 还 出 现在 两 个 
、 对 和 象 或 方法 乙 则 的 代码 逻辑 片段 和 重 堵 的 职责 之 内 。 


冰 


重复 是 不 好 的 ， 它 增加 了 代码 的 不 透明 性 ， 使 散落 在 各 处 的 概念 和 人 逻辑 很 难 理解 。 此 外 ， 对 于 修改 代码 的 程序 员 来 说 ， 每 一 
处 重复 都 是 额外 的 开销 ， 如 果 筷 记 在 所 有 必要 的 地 方 都 加 以 改动 ， 又 增加 了 出 现 bug 的 机 会 。 


5.1.1 示例 


襄 的 够 多 了 ， 我 们 看 看 代码 清单 .1 中 的 具体 例子 ， 它 展示 了 几 种 形式 的 重复 。 


一 个 含有 多 种 重复 的 简单 测试 类 


代码 清单 5.1 
public class TemplateTest { 
GTest 
public void emptyTemplate() throws Exception { 
assertEquals("", new Template("") .evaluate() ) ; 


} 

QTest 

public void plainTextTemplate() throws Exception { 
new Template("plaintext") .evaluate!()) 


assertEquals ("plaintext", 


. 
} 
见 的 文本 字符 串 重复 ， 在 两 个 断言 中 ， 空 串 和 plaintest 字 符 串 都 出 现 


上 自 旦 mA 


你 在 代码 清单 5.1 中 看 到 了 什么 样 的 重复 ?也 许 是 最 党 
了 两 次 ， 我 们 叫 这 种 重复 为 文字 重复 (literal duplication) 。 你 可 以 通过 定义 局 部 变量 来 移 除 它们 。 在 上 面 的 测试 类 中 还 存在 
清 


另 一 种 重复 ， 也 许 比 显而易见 的 字符 串 重 复 有 趣 得 多 。 当 我 们 提取 那些 局 部 变量 时 ， 这 种 重复 会 区 得 更 加 清晰 ， 下 面 让 我 们 清理 
下 这 个 粒 摊 子 。 


5.1.2 ”该 对 它 做 后 儿 什 么 
我 们 已 经 找到 了 字符 串 重 复 ， 让 我 们 先 开始 处 理 它 。 在 计算 机 编程 中 这 种 字符 捉 重 复 不 是 最 坏 的 ， 但 是 清理 这 些小 的 代码 坏 


味道 通 单 会 容易 上 友 现 更 大 的 重复 。 代 码 清 单 2.2 展 示 了 我 们 现在 的 改动 。 


代码 清单 5.2 通过 提炼 局 部 变量 来 突出 其 他 的 重复 


public class TemplateTest { 
GTest 
public void emptyTemplate() throws Exception { 
String template = ""; 
new Template (template) .evaluate!()) 


assertEquals (template, 


} 


QTest 
public void PlLalnTextTemp1lLate( ) 


String template "plaintext"; 
assertEquals (template, new Template(template) .evaluate()); 


throws Exception { 


看 看 上 面 两 个 测试 用 例 的 实现 ， 你 会 友 现 在 那 两 个 测试 遂 数 中 ， 只 有 字符 串 是 不 同 的 。 将 那些 不 同 的 部 分 提取 为 局 部 变量 以 
后 ， 剩 下 的 断言 何止 是 相似 ， 简 直 一 模 一 样 。 它 们 都 实例 化 了 一 个 Template 对 象 ， 调 用 了 evaluate 函 数 对 模板 求 值 ， 并 断言 此 


函数 返回 相应 的 字符 串 。 这 种 操作 不 同 数据 的 重复 逻辑 ， 我 们 叫做 结构 重复 (structural duplication) 。 以 上 的 两 个 代码 块 用 


一 致 的 结构 操作 了 不 同 的 数据 。 
让 我 们 去 挥 这 种 重复 ， 并 看 看 代码 会 变 成 什么 样 。 代 码 清单 2.3 中 的 测试 类 提炼 重复 后 ， 产 生 了 一 个 目 定 义 的 断言 万 法 。 


代码 清单 5.3 ”将 断言 中 的 重复 提炼 为 目 定 义 断 言 


public class TemplateTest { 
GTest 
public void emptyTemplate() throws Exception { 
assertTemplateRendersAsItself("").; 


} 


GTest 
public void plainTextTemplate() throws Exception { 
assertTemplateRendersAsItself ("plaintext").,， 


} 


private void assertTemplateRendersAsItself (String template) { 
assertEaquals (template, new Template(template) .evaluate() ) ; 


语义 重复 
重复 有 时 隐藏 在 我 们 的 视线 之 后 。 虽 然 我 们 可 以 通过 提炼 相似 的 结构 来 清晰 地 识别 文字 重复 和 结构 重复 ， 但 语义 重 
复 (semantic duplication) 则 不 同 ， 它 代表 着 用 不 同 的 实现 完成 相同 功能 或 概念 。 
如 下 是 一 个 语义 重复 的 例子 。 


GTest 

public void groupShouldContainTwoSupervisors() { 
List<Employee> all = group.1L1ist() ; 
List<Employee> employees = new ArrayList<Employee>(all); 


Iterator<Employee> 1 = employees.iterator(),; 
while (i.hasNext()) { 
Employee employee = i.next!().,; 
if (iIemployee.isSupervisor()) { 
1.remove(); 
} 
} 


assertEquals(2, employees.size!()); 


} 


@Test 
public void groupShouldContainFiveNewcomers() { 
List<Employee> newcomers = new ArrayList<Employee> () ; 
for (Employee employee : group.list()) { 
DateTime oneYearAgo = DateTime.now() .minusYears (1) ; 
if (employee.startingDate() .isAfter (oneYearAgo)) { 
newcomers .add (employee).,， 


} 


assertEquals(5, newcomers.size!()); 


除了 通过 group.list0 方 法 查询 雇员 的 完整 列表 之 外 ， 这 两 个 方法 没有 太 多 的 文字 重复 ,但 是 它们 又 很 相似 ， 都 是 查询 雇员 的 


完整 列表 并 通过 某 些 条 件 进行 过 滤 。 


我 们 倾向 于 用 以 下 方法 消除 语义 重复 : 第 一 步 ， 通 过 改变 过 滤 方 法 ， 使 之 成 为 结构 重复 。 第 二 步 ， 通 过 提炼 变量 和 方法 ， 消 
除 结 构 重 复 。 我 们 将 此 方法 留 作 读者 的 课 后 练习 。 


看 看 代码 清单 3.3， 你 会 友 现 所 有 的 重复 都 消失 了 ， 甚 全 局 部 变量 也 不 需要 了 。 如 此 实现 一 目 了 然 ， 易 于 理解 。 例 如 ， 如 果 
Template 对 象 的 接口 友 生 改变 ， 你 只 需要 修改 一 处 即 可 。 


5.1.3 ”小 结 


见 的 代码 坏 味道 ， 在 测试 代码 中 也 是 如 此 普遍 。 考 虑 到 测试 类 本 身 就 是 用 来 指定 一 个 小 代码 单元 的 各 种 行为 ， 那 
这 也 没什么 好 奇怪 的 。 测 试 代码 中 遍布 重复 ， 意 味 着 要 花费 更 多 时 间 来 维护 测 斌 一 更 不 用 说 去 追查 那些 由 于 忘记 更 新 所 有 重 
复 信息 而 产 


后 的 奇怪 错误 。 





平 运 的 是 ， 那 些 家 测试 感染 的 程序 员 已 经 有 了 一 些 对 付 重复 的 简单 有 效 措 施 。 例 如 ， 将 可 变数 据 提 炬 到 局 部 变量 ， 这 不 仅仅 
是 消除 文字 上 的 明显 重复 ， 更 是 一 种 凸显 结构 重复 的 蛙 越 技术 。 


去 除 重 复 也 可 能 会 过 度 。 毕 竟 你 的 兴趣 在 于 保持 代码 的 可 读 性 ， 使 读者 明日 它 的 意图 和 功能 。 考 虑 到 这 一 点 ， 可 能 会 有 一 些 
情况 下 一 一 特别 是 在 测试 代码 中 一 一 你 可 能 会 选择 保留 一 些 重 复 以 改进 代码 的 可 读 性 。 


我 们 下 一 个 测试 坏 味道 不 像 重 复 如 此 常 罗 ， 但 好 消息 是 它 很 容易 识别 ， 而 且 一 旦 你 了 解 它 ， 你 束 可 以 避免 这 种 味道 。 


[|] Structured Programming with go to Statements> , Donald Knuth, Computing Surveys, Vol.6, No.4, 1974.Stanford Univetsity。 

[2] 设计 模式 四 人 帮 (GoF) 之 一 ，Etich Gamma 在 他 的 论文 《Test Infected : Programmets Love Wtiting Tests》 中 首次 发 明了 这 个 
术语 ， 用 于 描述 那些 喜欢 做 软件 测试 的 程序 员 。 
[3] 鲍 勃 大 叔 (Uncle Bob) 在 2008 年 首次 在 敏捷 宣言 中 加 入 第 五 项 价值 ， ”Craftsmanship ovet Execution ” ， 并 在 不 久 ， 独 立 为 





译 者 注 





软件 匠 艺 宣言 。 软 件 工匠 相信 软件 是 一 种 工艺 品 ， 并 为 之 努力 打造 昔 越 的 产品 。 译 者 注 
[4 鲍 勃 大 上 披 〈Uncle Bob) 的 又 一 力作 《代码 整洁 之 道 》 对 其 有 详细 的 介绍 。 译 者 注 





5.2 “条件 逻辑 


我 们 编写 自动 化 测试 的 理由 是 多 种 多 样 的 。 我 们 从 回归 测试 中 寻求 安全 感 ， 期 盼 测试 能 及 时 指出 我 们 犯 的 错 。 我 们 依靠 测试 
协助 规划 代码 的 行为 。 我 们 也 依靠 测试 来 理解 代码 的 功能 和 责任 。 关 于 最 后 一 点 特别 要 说 一 句 ， 测 试 中 存在 的 条 件 逻 
辑 (conditional logic) 一 般 不 是 件 好 事 儿 。 它 是 坏 味 道 。 


假设 我 们 正在 重 构 并 运行 测试 来 确保 一 切 正 党， 此 时 我 们 上 友 现 某 个 测试 失败 了 。 这 真是 出 乎 意料 ， 我 们 没 想 到 这 点 儿 变 更 却 
会 影响 测试 ， 但 它 的 确 友 生 了 。 我 们 从 失败 的 测试 开始 检查 堆栈 跟踪 (stack trace) ， 打 开心 爱 的 编辑 器 ， 试 图 找 出 真相 ， 却 
突然 友 现 自己 无 法 知道 失败 的 测试 当时 在 干什么 。 


正 因 在 这 个 场景 中 面临 挣扎 ， 我 们 才 要 在 测试 代码 中 避免 条 件 逻 辑 。 让 我 们 用 一 个 更 具体 的 例子 来 展示 这 个 问题 。 
5.2.1 示例 


代码 清单 5.4 中 的 测试 创建 了 Dictionary (字典 ) 对 销 ， 用 数据 填充 它 ， 并 验证 请 求 到 的 lterator ( 运 代 器 ) 中 的 内 容 是 正确 
的 。 


代码 清单 5.4 测试 代码 中 的 条 件 逻 辑 是 维护 负担 


public class DictionaryTest { 
QTest 


public void returnsAnIteratorForContents() throws Exception { 
Dictionary dict = new Dictionary() ; 外 填充 字典 
dict.add("A", new Long(3) ) ; 
act da "Bs", "DO"™s 
for (Iterator e = dict.iterator(); e.hasNext();) { 
Map.Entry entry = (Map.Entry) e.next();} 4 
if ("A".equals (entry.getKey())) { 条 的 遍历 条 目 
assertEquals(3L, entry.getValue()).; 
, 刍 值 进 生 
if ("B".equals (entry.getKey())) { 断言 
assertEquals("21", entry.getValue()); 


二 就 
对 叉 


如 你 所 见 ， 就 算 该 测试 针对 的 只 是 Dictionary@@ 对 象 的 琐碎 行为 ， 它 仍然 非常 难以 解析 和 理解 。 而 且 ， 我 们 阅读 for 循 环 和 并 
块 时 会 看 到 测试 将 两 个 条 目 填 充 到 Dictionary， 遍 历 @ 返 回 的 lterator， 并 根据 键 (key) 检查 条 目的 值 (value) @， 


测试 实际 上 期 望 能 在 lterator 中 找到 填充 的 那 两 个 条 目 。 在 修改 测试 时 ， 比 方 说 通过 重 构 来 改变 Dictionary 类 的 AP1， 我 们 的 
目标 是 使 意图 明确 和 减少 出 错 概 率 。 对 于 测试 代码 中 的 全 部 条 件 执行 语句 ， 我 们 很 容易 认为 某 个 断言 已 经 通过 但 实际 上 却 没有 运 


V 一 


行 过 。 这 是 我 们 要 避免 的 。 
5.2.2 ”该 对 它 做 点 儿 什 么 


这 种 情况 在 处 理 过 度 复 杂 的 代码 时 经 常 遇 到 ， 第 一 步 束 是 简化 它 ， 是 将 一 段 代 码 提炼 到 独立 且 命 名 良好 的 方法 中 。 代 码 
清单 5.4 中 复杂 性 全 都 在 于 for 循 环 中 ， 那 么 我 们 看 看 如 何 来 提炼 它 。 


代码 清单 5.5 ”通过 提炼 一 个 目 定 义 断 言 来 清理 测试 


GTest 
public void returnsAnIteratorForContents() throws Exception { 
Dictionary dict = new Dictionary{): 


do aA a Tew Dong(3) ys 

hota Ue Mo 

assertContains(dict.iterator(), "A", 3L);} -© 简单 的 自 定义 
assertContains(dict,iterator(); "B", "21"); 靳 言 


} 


private void assertContains (Iterator 1, Object key, Object value) { 
while (i.hasNext()) { 


Map.Entry entry = (Map.Entry) i.next().; 


if (key.equals (entry.getKey())) { 代 则 我 们 要 
assertEaquals (value, entry.getValue()); Te 是 什么 
ecurr 

} 

} 
fail("Iterator didn't contain " + kev + " => " + Vvalue); -++ 人 全 信 测试 失败 


代码 清单 5.5 中 将 原来 的 for 循 环 蔡 换 为 自 定义 断言 @， 使 测试 本 身 变 得 简单 。 提 炼 出 的 方法 中 仍然 存在 循环 ， 但 是 测试 的 意 
图 变 得 清晰 ， 使 得 可 维护 性 大 不 相同 了 。 


代码 清单 5.5 还 更 正 了 原先 测试 中 的 另 一 个 问题 。 具 体 来 说 ， 鉴 于 之 前 代码 清单 5.4 中 的 for 循 环 用 法 ， 即 使 lterator 是 空 的 ， 
测试 也 不 会 失败 。 在 代码 清单 5.5 我 们 是 这 样 修改 的 ， 当 找到 预期 条 目 人 @ 就 使 断言 返回 ， 而 如 果 没 找到 符合 的 条 目 就 使 测试 失败 
@ 

你 最 好 记 住 这 个 常见 模式 。 顺 便 说 一 句 ， 最 后 的 fail() 调 用 很 容易 被 漏 掉 ， 导 致 测试 虽然 通过 但 是 代码 却 不 工作 ， 令 人 头 
痛 。 长 点 儿 心 吧 ! 


5.2.3 “人 小结 
我 们 依靠 测试 来 理解 代码 的 实际 行为 和 预期 行为 。 如 果 修 改 代 码 时 不 小 心 破坏 了 什么 ， 我 们 得 依靠 测试 来 警告 自己 。 条 件 逻 
辑 使 这 一 切 更 加 困难 也 更 容易 出 错 。 


条 件 执行 语句 使 代码 难以 理解 ， 而 你 在 修改 代码 之 前 需要 先 理 解 代码 。 如 果 你 友 现 目 己 正在 调试 的 测试 充满 了 条 件 语句 ， 你 
就 很 难 弄 清 究竟 在 执行 的 是 什么 ， 以 及 它 是 如 何 失败 的 。 此 外 ， 有 时 你 友 现 条 件 执行 语句 切除 了 断言 ， 把 它们 全 都 跳 过 去 了 ， 造 
成 了 一 种 正确 性 的 错 沈 。 

简 而 言 之 ， 你 应 该 在 测试 方法 中 避免 条 件 执 行 结 构 ， 例 如 if、else、for、while 和 switch 等 。 当 测试 要 检查 的 行为 比较 复杂 
时 ， 这 一 点 尤其 重要 。 这 些 语言 结 构 固然 上 有用， 但 对 于 测试 代码 ， 你 应 该 小 心 行事 。(' 为 了 测试 的 可 维护 性 ， 你 需要 保持 测试 的 
复杂 度 低 于 对 应 的 解决 方案 。 

测试 代码 中 的 条 件 逻 辑 是 很 难 理 清 的 ， 但 是 相当 容易 识别 出 来 。 接 下 来 的 测试 坏 味 诅 才 是 一 块 难 嘴 的 硬骨头 。 


[1] 循环 及 其 他 条 件 语句 可 以 成 为 构建 测试 辅助 方法 (test helper) 的 基本 工具 。 然 而 在 测试 方法 中 ， 这 些 结构 往往 是 主要 的 干 
扰 。 


5.3 ” 脆 旨 测试 
自动 化 测试 在 很 多 情况 下 都 是 程序 员 最 好 的 朋友 。 就 像 我 们 在 真实 生活 中 的 朋友 ， 我 们 应 该 能 够 信任 代码 库 中 的 朋友 一 一 


那些 测试 遇 到 偶然 错误 时 就 会 立即 提醒 我 们 。 有 时 候 ， 某 个 朋友 可 能 根本 不 值得 信赖 。(1 我 能 想到 最 差 的 测试 坏 味 道 之 一 ， 其 实 
很 简单 ， 就 是 一 个 不 断 失 败 的 测试 一 一 而 且 习 以 为 常 。 





修改 代码 导致 了 测试 失败 一 一 那 是 件 好 事情 ， 测 试 显然 注意 到 了 你 认为 重要 而 需要 检查 的 变更 一 这 不 同 于 一 直 失 败 的 测 
试 。 我 们 况 的 是 一 直 亮 了 两 周 红 灯 的 测试 ， 而 且 没 人 去 修复 它 。 那 个 测试 大 概 会 继续 再 失败 两 周 或 者 两 个 月 ， 直 到 有 人 修复 它 ， 
或 者 更 有 可 能 的 是 ， 删 挥 它 。 这 都 在 情理 之 中 ， 因 为 一 直 失 败 的 测试 几乎 是 没 用 的 。 你 无 法 从 它 那 里 得 知 任何 你 还 不 知道 的 事 
情 ， 或 者 可 以 信任 的 事情 。 


还 有 一 种 失败 的 测试 市 给 我 们 的 生活 不 必要 的 麻烦 : 断断续续 失败 的 脆弱 测试 。 脆 弱 的 意思 融 像 喊 “ 狠 来 了 ”， 也 网 是 训 ， 
虽然 测试 使 构建 失败 了 ， 但 是 你 去 看 的 时 候 ， 再 次 执行 却 又 通过 了 ， 刚 才 似乎 只 是 个 意外 。 


我 们 看 个 例子 ， 膏 况 我 引用 这 个 伊 系 寓言 究竟 要 传达 什么 想法 。 


5.3.1 示例 


大 多 数 情 况 下 ， 脆 弱 测 试 失败 时 都 涉及 了 线程 和 竞 态 条 件 ， 其 行为 依赖 于 日 期 或 时 | 间 ， 或 测试 依赖 于 计算 机 的 性 能 ， 因 而 在 


运行 期 间 受 到 MO 速度 或 CPU 负载 的 影响 。 访 问 网 络 资源 的 测试 有 时 也 会 表现 得 脆弱 ， 比 如 当 网 络 或 资源 临时 不 可 用 的 时 候 。 
代码 清单 3.6 中 的 例子 展示 了 一 个 我 不 止 一 次 础 到 的 问题 : 对 文件 系统 时 间 戳 的 错误 假设 。 


代码 清单 2.6 ”测试 按时 间 截 排序 的 汇 思 日 志 


GTest 

public vold logsAreOrderedByTimestamp() throws Exception { 
generateLogFile(logDir, "app-2.10g", "one"); 
generateLogFile(logDir, "app-l1.1og", "two"); 产后 一 些 
generateLogFile(logDir, "app-0.1]og", "three'" ) ; 日 志文 件 
generateLogFile(logDir, "app.l1og", "four'" ) ; 
LOog aggregate = AggregateLogs.collectAll (logDir).; 
assertEquals (asList ("one", "two", "three", "four"), 期 望 菜 种 

aggregate.asList()).,， 顺 厚 
} 


测试 的 问题 在 于 ， 被 测 逻 辑 依赖 于 文件 的 时 间 戳 。 我 们 期 望 日 志文 件 按照 时 间 戳 顺序 进行 汇总 ， 将 最 早 修 改 的 文件 作为 最 旧 
的 日 志文 件 ， 以 此 类 推 ， 并 没有 按照 文件 名 的 字母 顺序 对 日 志文 件 进 行 排 序 。 结 果 令 我 们 失望 了 。 这 个 测试 在 Linux 上 时 不 时 地 
失败 ， 而 在 Mac OS X 上 几乎 总 是 失败 。 我 们 看 看 测试 中 用 来 写 日 志文 件 的 generateLogFile() 方 法 : 


private void generateLogFile(final File dir, final String name, 
final String... messages) { 
File file = new File(dir, name),， 
for (String message : messages) { 
IO.appendToFile(file, message); 


我 们 栽 在 了 忘记 给 创建 日 志文 件 的 被 测 方法 传递 时 间 。 有 具体 来 襄 ， 我 们 忘记 了 在 不 同 的 计算 机 和 平台 上 时 间 流 逝 得 不 一 样 。 
某 些 平台 ， 比 如 Mac OS X， 文 件 系统 时 间 戳 每 秒 跳动 一 次 ， 也 就 是 说 除非 文件 生成 时 间 足 够 长 ， 或 者 文件 生成 地 恰到好处 ， 否 
则 下 一 次 generateLogFile( 调 用 杖 有 可 能 导致 日 志文 件 带 有 相同 的 时 间 戳 。 


情况 够 复杂 的 ， 那 么 接 下 来 说 说 你 对 于 这 种 问题 能 做 些 什 么 。 


5.3.2 ”该 对 它 做 后 儿 什 么 


与 时 间 相 关 的 问题 ， 特 别 是 当 我 们 想 要 将 时 间 传 递 给 测试 ， 程 序 员 普遍 会 增加 一 个 Thread#sleep 调 用 。 别 这 样 。 
Thread#sleep 方 案 的 问题 在 于 它 几 平 是 不 确定 的 一 一 仍然 无 法 保证 流 池 了 足够 的 时 间 。 你 可 以 更 夸张 更 安全 点 儿 ，sleep 整 整 一 
秒 而 非 100 毫 秒 ， 这 大 不 多 够 了 。 

但 这 个 补救 办 法 的 成 本 就 高 了 ， 你 的 测试 套件 会 因 每 个 新 增 的 Thread#sleep 而 变 得 越 来 越 慢 。 

相反 ， 当 你 的 测试 遇 到 时 间 相 关 的 问题 时 ， 你 应 该 先 通过 适当 的 APl 来 模拟 相应 的 情况 。 对 于 用 正确 时 间 戳 来 产生 日 志文 件 
这 个 例子 ， 你 可 以 依靠 Java 的 File API， 用 setLastModified 明 确 地 递增 每 个 日 志文 件 的 时 间 戳 。 代 和 码 清单 5.7 显 示 了 修改 后 的 工 
具 方 法 。 


代码 清单 5.7 ”区 别 设置 时 间 戳 


private AtomicLong timestamp = 
new AtomicLong (currentTimeM1il1lis()); 0 记录 时 间 惟 


private void generateLogFile(final File dir, final String name, 
final String... messages) { 
File file = new File(dir, name),， 
for (String message : messages) { 
IO.appendToFile(file, message).; 


} 9 区 别 设置 
file.setLastModified(timestamp.addAndGet (TEN_SECONDS ) ) ; 时 间 签 


简单 地 增加 了 一 个 AtomicLong 对 象 @， 并 调用 File#setLastModified@ 为 每 个 日 志文 件 明 确 地 递增 该 对 象 ， 这 样 我们 就 有 
效 地 确保 每 个 日 志文 件 都 收 到 了 不 同 的 时 间 戳 。 


如 此 融 不 再 依靠 隐 陈 的 和 不 确定 的 行为 ， 这 使 代码 清单 .6 中 的 测试 能 够 可 靠 地 工作 于 所 有 平台 和 计算 机 ， 而 不 需要 再 缓慢 
地 执行 测试 了 。 


对 于 间 欣 性 的 测试 失败 ， 时 间 截 并 非 唯 一 的 麻烦 来 源 。 最 突出 的 是 多 线程 ， 它 往往 会 使 事情 复杂 化 。 涉 及 随机 数 生 成 的 也 好 
不 到 哪儿 去 。 有 些 情况 更 为 明显 ， 有 些 则 没 那 么 明显 ， 真 是 防不胜防 。 无 论 我 们 是 否 提 早 意 识 到 要 针对 随机 测试 失败 来 保护 目 
己 ， 我 们 解决 这 些 情况 的 方法 都 是 一 样 的 : 


最 简单 的 办 法 就 是 彻底 地 规避 这 个 问题 ， 切 断 任何 不 确定 行为 的 来 源 。 例 如 ， 我 们 可 以 通过 文件 名 的 数字 后 缀 而 非 时 间 截 来 
对 日 志文 件 排序 。 


如 果 不 能 轻易 地 绕 过 坏 手 的 部 分 ， 我 们 融 试 图 控制 尼 。 例 如 ， 可 以 采用 fake (伪造 对 象 ) 来 代 蔡 随 机 数 生成 器 ， 令 其 精确 
地 返回 我 们 需要 的 值 。 


最 后 ， 如 果 找 不 到 一 个 方法 来 充分 地 规避 或 控制 这 个 问题 的 源头 ,我 们 的 最 后 一 招 束 是 将 难题 隔离 在 尽 可 能 小 的 学 围 内 。 这 
吏 将 大 多 数 代码 从 不 确定 行为 中 解脱 出 来 ， 从 而 在 一 处 而 且 仅仅 一 处 来 解决 难题 。 


5.3.3 小结 


随机 失败 的 脆弱 测试 像 大 多 数 赌场 一 样 不 可 人 和信， 它们 珊 来 的 麻烦 通 弟 多 于 价值 。 你 不 项 
使 菏 个 人 停 下 手 里 的 活 儿 ， 最 后 却 友 现 “ 又 是 那个 测试 ”。 你 不 该 陷入 绝望 ， 或 者 轻易 放弃 
和 获得 信赖 。 


望 看 到 这 种 测试 使 构建 失败 ， 而 且 但 
， 因 为 这 种 测试 并 不 是 那么 难以 修复 


无 论 间歇 性 失败 的 起 因 是 过 度 信 和 赖 系统 时 钟 ， 还 是 由 于 执行 时 机 、 并 发 访问 共享 数据 ， 抑 或 产生 随机 结果 的 对 象 ， 你 其 实 都 
有 很 多 选择 。 你 可 以 尝试 变通 这 个 问题 ， 控 制 不 确定 行为 的 源头 ,或 者 隔离 和 处 理 掉 所 有 恶心 之 物 。 尤 其 ， 多 线程 逻辑 的 测试 可 
以 是 事 无 巨细 的 ， 因 为 你 要 考虑 所 有 同步 对 象 ， 以 便 在 测试 执行 时 对 付 几乎 不 可 预测 的 线程 调度 。[ 


现在 我 们 看 一 个 通常 更 容易 去 除 的 代码 坏 味 道 。 


[中 严肃 点 儿 ， 显 然 我 的 朋友 们 没有 一 个 是 这 样 的 。 (以 防 万 一 你 读 到 了 这 里 。) 


D] 更 多 讨论 请 见 《Test Driven 》 (Manning Publications，2007) 一 书 的 第 7 章 。 


5.4 区 缺 的 文件 路 径 


残缺 的 文件 路 径 会 使 你 无 法 转移 代码 ， 除 了 目 己 的 计算 机 之 外 ， 在 任何 其 他 人 的 计算 机 上 都 无 法 运行 。 我 们 都 知道 这 个 问 
题 。 假 如 你 从 没 读 过 代码 ， 却 天 生 残 懂得 说 “我 们 不 应 该 在 这 里 硬 编码 这 个 路 径 。”， 或 者 天 生 就 知道 明确 地 引用 文件 系统 某 个 位 
置 会 目 寻 烦 恼 ， 那 瓯 怪 了 。 

不 论 这 个 代码 坏 味道 名 气 大 小 ， 但 它 的 确 太 党 见 了 。 而 且 ， 有 很 多 方式 会 因 文 件 路 径 而 导致 你 步履 跨 咒 ， 接 下 来 束 看 个 例 
子 ， 然 后 探讨 一 下 。 


5.4.1 示例 


代码 清单 5.8 中 的 例子 展示 了 一 个 简单 的 测试 用 例 ， 它 及 用 绝对 路 径 从 文件 系统 读 出 一 份 文档 。 在 第 2 草 中 我 们 学 到 了 应 当 避 
免 在 单元 测试 中 访问 文件 。 但 现在 退 后 一 步 ， 不 妨 假 设 我 们 现在 继承 了 某 些 访问 文件 系统 的 测试 代码 。 代 码 清单 5.8 展 示 了 罪魁 
人 锅 目 。 


代码 清单 3.8 ”绝对 文件 路 径 能 很 快 地 绊 倒 你 的 测试 


public class XmlProductCatalogTest { 
private ProductCatalog catalog; 


QBefore 
public void createProductCatalog() throws Exception { 
File catalogFile = new File("C:\\workspace\\catalog.xml"),; 


catalog = new XmlProductCatalog (parseXmlFrom(catalogF1ile)).; 
} 


@Test 
public void countsNumberOfProducts() throws Exception { 
assertEquals(2, catalog.numberOfProducts()).,， 


} 


// remaining tests omitted for brevity 


文件 路 径 有 什么 问题 ? 首先 ， 绝 对 文件 路 径 明 显 地 绑 定 了 Microsoft Windows 操 作 系 统 。 开 发 者 要 是 在 Mac 或 Linux 系 统 上 
运行 测试 ， 马 上 会 得 到 “ 找 不 到 文件 ” (file not found) 之 类 的 MO 错误 。 这 段 测试 代码 不 是 自 包含 的 (self-contained) 。 你 
需要 从 版 本 控制 系统 中 检 出 代码 ， 然 后 马上 就 看 到 所 有 测试 都 通过 。 用 了 代码 清单 5.8 中 这 种 特定 于 平台 的 绝对 文件 路 径 ， 想 都 


别 想 了 。 


5.4.2 ”该 对 它 做 点 儿 什 么 


我 们 现在 有 一 个 仅 限 于 Windows 的 绝对 文件 路 径 。 它 不 能 在 任何 Mac 或 Linux 系 统 上 工作 。 除 非 我 们 全 都 是 Windows 用 
户 ， 人 否则 我 们 至 少 应 该 将 路 径 改 为 与 平台 无 和 天， 比如 Java 的 File APl 支 持 这 样 做 : 


new File("/workspace/catalog.xml").; 


在 Windows 和 UNIX 两 个 平台 家 族 中 ， 它 都 能 胜任 ， 比 如 你 使 用 Windows 上 的 C 盘 ， 那 么 路 径 就 是 C:\workspace， 而 在 


UNIX 系 统 上 路 径 惑 是 /workspace。 


我 们 仍然 被 绑 定 在 workspace 这 个 特定 位 置 上 。 这 不 像 绑 定 特定 用 户 名 那么 糟糕 (比如 : /User/lasse) ， 上 但 其 实 仍 会 强 
迫 所 有 开 友 者 都 将 自己 的 工作 区 (workspace) 放 在 相同 的 物理 位 置 上 。 


简 而 言 之 ， 当 你 在 测试 代码 中 处 理 文件 时 ， 应 该 避免 绝对 路 径 。 当 然 也 会 有 可 以 接受 的 例外 情况 ， 但 作为 一 条 经 验 之 谈 ， 你 
还 是 尽量 避 开 它们 吧 。 相 反 ， 尽 量 米 用 抽 销 引用 ， 比 如 系统 属性 (system property) 、 环 境 变量 ， 或 任何 能 获得 的 相对 路 径 。 


我 不 建议 像 System.getProperties (“user.home”) 这 样 来 选择 相对 路 径 ， 虽 然 在 所 有 平台 上 都 会 返回 一 个 有 效 的 路 径 ， 
但 是 那些 引用 里 面 仍然 是 绝对 路 径 ， 仍 会 强迫 开发 者 们 将 其 工作 区 放 在 指定 位 置 。 尤 其 当 你 开发 新 版 本 同时 还 要 维护 旧版 本 ， 这 
种 情况 就 非常 坏 手 。 每 当 你 从 新 开发 工作 切换 到 旧 分 支 改 bug 时 ， 你 不 得 不 在 未 完成 工作 的 基础 上 检 出 旧 分 支 ， 因 为 绝对 路 径 永 
远 指向 同一 个 位 置 。 
用 流 (stream) 来 蔡 换 文件 


到 目前 为 止 你 可 能 注意 到 API 似 乎 给 你 造成 了 各 种 可 测 性 麻烦 。 考 虑 到 这 一 点 ， 在 你 的 内 部 API 中 使 用 javaio.InputStteam 和 


java.io.OutputStream 来 代替 java.io.File， 这 可 能 是 个 好 主意 。 
] p ] 


一 个 直接 的 好 处 是 你 总 能 替换 测试 替身 ， 因 为 它们 是 接口 ， 而 非 像 java.io.File 一 样 的 不 可 修改 (final) 类 。 也 就 是 说 你 无 需 担 
心 文件 路 径 和 幽灵 文件 〈ghost fle) ， 除 非 你 真 的 在 乎 那些 文件 在 硬盘 上 的 物理 位 置 。 


在 测试 中 你 可 以 传 入 纯 内 存 对 象 ， 比如 avaio.ByteAttayIhputStteam 和 java.io.ByteAttay-OutputStteam ， 来 代替 


javaio.FlileInputStteam 和 java.io.FileOutputStteam 。 


总 是 尽 可 能 去 引用 相对 路 径 ， 当 走投无路 时 再 考虑 绝对 路 径 。 只 要 待 处 理 的 文件 存在 于 项 目的 根 目录 下 ， 相 对 路 径 就 能 民 好 
地 工作 。 在 我 们 的 例子 中 ， 登 记 册 (catalog document) 将 存放 在 PROJECT ROOT/src/test/data/catalog.xmlIl 中 。 然 后 我 们 
会 以 相对 路 径 来 引用 它 ， 如 下 : 


new File("./src/test/data/catalog.xml").; 


通过 1DE 或 构建 脚本 来 运行 测试 时 ， 相 对 路 径 将 会 按照 项 目的 根 目录 来 重新 计算 ， 如 此 一 来 ， 像 我 这 种 Mac 用 户 就 可 以 将 工 
作 区 放 在 /Users/lasse/work 下 ， 而 用 Linux 的 小 伙伴 Sam 就 能 把 他 的 工作 拷贝 保存 在 /projects/supersecret 下 。 而 且 ，Sam 可 
以 将 整个 工作 拷贝 移动 到 另 一 个 位 置 ， 不 用 修改 代码 中 的 任何 文件 路 径 ， 一 切 仍旧 正音 工作 。 


襄 到 文件 的 移动 ， 还 有 一 种 方法 值得 一 提 。 如 果 待 处 理 的 文件 与 处 于 同一 包 (package) 中 的 特定 测试 类 绑 定 在 一 起 ， 也 许 
放 茎 掉 文 件 系 统 更 有 意义 ， 并 代 之 以 Java 的 classpath 来 定位 文件 。 假 设 我 们 有 一 个 测试 类 叫做 XmlProductCatalogTest， 它 存 
放 在 com.manning.catalog 包 中 。 源 代码 文件 位 于 src/test/java/com/manning/catalog/XmlProductCatalogTest.java。 现 
在 ， 如 果 你 把 用 于 登记 的 XML 文 档 也 放 在 一 起 一 一 src/test/java/com/manning/catalog/catalog.xm| 一 一 那么 你 束 可 以 在 测 
试 代码 中 这 样 来 查找 它 : 

String filePath = getClass() .getResource("catalog.xml") .getFile().; 

File resource = new File(filePath); 


这 里 展示 的 class path API 使 得 你 能 够 访问 位 于 class path 中 的 文件 ， 因 为 它 通过 处 于 同一 包 中 的 类 进行 查找 ， 所 以 你 无 需 
硬 编码 包 名 。 四 换 句 话说 ， 如 果 你 决定 在 重 构 时 将 测试 类 移动 到 另 一 个 包 ， 只 要 记得 把 数据 文件 一 起 移 过 去 ， 那 你 就 不 必修 改 任 
何 文件 路 径 引用 。 


5.4.3 “小结 


你 知道 绝对 路 径 只 能 在 一 种 操作 系统 上 工作 ， 这 通 单 是 一 个 坏 主意 。 即 使 我 们 今天 都 在 用 同一 个 平台 ， 也 不 代表 明天 不 会 有 
人 升级 到 最 新 版 的 Windows， 或 从 Windows 迁 移 到 Linux， 或 者 换 台 酷 炉 的 Mac 迎 接 大 家 入 桶 的 目光 。 


这 不 仅 是 天 于 操作 系统 。 使 用 绝对 路 径 更 基本 的 问题 在 于 ， 即 使 你 用 跨 平 台 的 方式 来 表示 已， 它 仍然 奇 刻 地 要 求 所 有 开发 者 
都 要 将 资源 放 在 特定 位 置 。 这 样 做 非 音 烦人， 比如 ， 当 你 在 多 个 分 文 乙 间 切 换 的 时 候 。 的 确 ， 你 可 以 检 出 项 目 代 码 的 多 个 工作 拷 
贝 ， 但 是 它们 都 因 绝对 路 径 而 指向 同一 个 位 置 。 


党 试 将 所 有 项 目 资源 都 放 在 项 目的 根 目 录 下 吧 ， 这 是 经 验 之 谈 。 这 样 你 就 能 在 代码 和 构建 文件 中 使 用 相对 文件 路 径 。 对 于 测 
试 代码 用 到 的 人 资源， 你 还 可 以 考虑 将 那些 数据 文件 与 测试 代码 放 在 一 起 ， 然 后 通过 classpath 来 查找 。 


襄 到 这 ， 有 一 个 例外 ， 并 非 所 有 文件 都 应 该 存在 于 项 目 根 目录 下 。 永 久 的 临时 文件 融 是 这 样 一 个 例子 。 


[1 。 想象 一 个 项 目 ， 每 个 人 都 要 在 自己 的 系统 中 创建 了 第 二 个 用 户 ， 因 为 首席 开发 者 在 代码 中 到 处 硬 编 码 自己 的 主 目 录 (home 
directory) 。 甚 至 生产 环境 中 的 Web 服务 器 也 运行 在 他 的 用 户 名 下 。 这 像 是 专业 的 做 法 吗 ? 
DP] 你 仍旧 可 以 那么 干 ， 只 要 你 乐意 就 行 。 


5.5 “永久 的 临时 文件 
临时 文件 应 该 是 暂时 性 的 ， 使 用 后 即 抛弃 和 删除 。 永 久 的 临时 文件 这 个 测试 坏 味道 ， 指 的 是 临时 文件 并 非 暂 存 而 是 被 保留 了 
下 来 ， 也 就 是 说 在 下 个 测试 运行 前 它 都 不 会 被 删除 。 


俗话 说 ，“ 脐 测 是 失败 之 母 ” ， 而 程序 员 往 往 就 假设 临时 文件 是 暂时 性 的 。 这 会 带 来 一 些 意外 ， 而 那 正 是 我 们 试图 避免 去 调 
试 的 行为 。 事 实 上 ， 你 应 该 尝试 根本 不 使 用 文件 ， 因 为 它 根本 不 是 你 要 测试 的 对 象 。 


襄 到 这 ， 我 们 深入 一 个 永久 临时 文件 的 例子 ， 用 更 具体 的 术语 来 解释 它 所 市 来 的 问题 。 
5.5.1 示例 


想象 针对 一 个 基于 文件 的 产品 登记 册 (product catalog) 对 象 的 一 系列 测试 。 第 一 个 测试 会 创建 一 个 空 的 临时 文件 ， 不 包 
侣 任何 条 目 ， 然 后 用 空 文件 急 始 化 登记 册 ， 并 检查 登记 册 如 期 为 空 。 


第 二 个 测试 不 创建 文件 ， 而 是 基于 一 个 缺失 的 文件 来 初始 化 登记 册 ， 登 记 册 这 时 应 该 表现 得 束 好 像 那个 文件 存在 似 的 ,但 只 








是 个 空 文件 。 第 三 个 测试 又 创建 一 个 临时 文件 一 一 这 次 包含 了 两 个 产品 一 一 用 该 文件 来 初始 化 登记 朋 ， 然 后 检查 登记 册 确 实 包 
含 了 那 两 个 产品 。 


代码 清单 5.9 展 示 了 这 个 测试 类 的 有 趣 之 处 。 


代码 清单 5.9 ”工作 在 临时 文件 上 的 测试 


public class XmlProductCatalogTest { 
private File tempfile; 


省 "| 小 圳 1 
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临时 文件 


a@Before 

public void prepareTemporaryFile() ({ 
String tmpDir = System.getProperty ("Java.1o.tmpdir").; 
tempfile = new File(tmpdir, "catalog .ml"),; 





} 

ETest 

Public Vol initializedWithEmptyCatalog{(} throws Exception { 
populateCatalogWithProducts (0); 
ProductCatalog catalog = new XmlProductCatalog (tempfile).: 
assertEquals (0, catalog.numberoOfProducts()):; 


} 


BTeSt 
public voidqd initializedwithMissingcatalog(} throws Exception 1 
ProductCatalog catalog = new XmlProductcCatalog (tempfile)})., < catalog.xml 


a i Nn = 
个 htt 有 -和 
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assertEquals (0, catalog.numberoOfProducts()).; 莹 存在 
} 


aTest 

Public void initializedWithPpopulatedCatalog() throws Exception { 
populatecatalogWithProducts (2); 
ProductCatalog catalog = new Xml]lProductCatalog (tempfile).,; 
assertEgquals(2, catalog.numberOfProducts()): 


当 JUnit 开 始 执 行 这 个 测试 类 时 ， 会 在 每 个 测试 之 前 用 新 的 File 对 象 来 初始 化 @ 私 有 字段 tempfile。 没 问题 。 问 题 在 于 第 二 个 
测试 ， 当 initializedWithMissingCatalog 开 始 执 行 时 ， 系 统 的 临时 目录 中 已 经 存在 一 个 空 的 catalog.xml@ 文 件 ， 这 与 测试 的 假 
设 大 相 径 庭 。 


这 意味 着 无 论 XmlProductCatalog 是 否 正确 地 处 理 了 文件 缺失 ， 测 试 都 能 通过 。 不 妙 。 


5.5.2 ”该 对 它 做 点 儿 什 么 


一 般 来 况 ， 能 不 用 物理 文件 残 尽 量 不 用 ; 比 起 操作 字符 串 或 其 他 类 型 的 内 存 块 来 说 ， 文 件 |/O 会 使 得 测试 变 慢 。 说 到 这 ， 当 
你 处 理 测试 中 的 临时 文件 时 ， 你 需要 记 住 临时 文件 并 不 是 随时 保持 临时 性 的 。 


例如 ， 如 果 你 用 File#createTempFile API 获 得 一 个 临时 文件 ， 文 件 就 和 你 手中 的 其 他 文件 引用 一 样 ， 不 再 是 暂时 性 的 了 。 
除非 你 明确 地 删除 它 ， 人 否则 文件 在 测试 结束 后 哪 也 不 会 去 。 相 反 ， 它 就 是 一 个 待 在 原 地 的 幽灵 文件 ， 有 可 能 造成 看 似 不 稳定 的 测 
试 失败 问题 。 


于 是 针对 临时 文件 的 处 理 ， 我 们 归纳 出 几 条 简单 的 指导 方针 : 
. 在 @Before 中 删除 文件 。 

` 如 果 可 能 的 话 ， 使 用 唯一 的 临时 文件 名 。 

" 要 天 清楚 文件 是 否 应 该 存在 。 


天 于 第 一 条 ， 程 序 员 有 时 会 用 File#deleteOnExit 将 临时 文件 标记 为 删除 ， 然 后 快乐 地 继续 工作 。 那 样 做 是 不 够 的 ， 因 为 文 
件 在 J 久 VM 进程 退出 之 前 并 没有 真正 地 删除 。 相 反 ， 你 需要 在 每 个 测试 方法 使 用 文件 之 前 就 删除 它们 ， 我们 残 给 setup 增 加 一 条 语 
人 句 : 


GBefore 

public void prepareTemporaryFile() { 
String tmpDir = System.getProperty("Java.1io.tmpdir").; 
tempfile = new File(tmpdir, "catalog.xml").; | 
tempfile.delete(); 


明确 地 在 @Before 中 删除 文件 ， 确 保 当 测试 开始 执行 时 ， 指 定 路 径 下 不 存在 文件 。 


其 次 ， 当 文件 名 和 位 置 不 需要 那么 精确 时 ， 推 荐 使 用 File#createTempFile。 你 能 够 确保 在 每 次 测试 时 得 到 唯一 的 文件 名 ， 
这 样 你 束 不 必 担 心 从 另 一 个 测试 继承 来 一 个 幽灵 文件 。 本 例 中 将 setup 方 法 修改 成 如 下 : 


@QBefore 
Public void prepareTemporaryFile() { 

tempfile = File.createTempFile("catalog", ".xml"),; 
} 


再 者 ， 当 你 不 天 心 文件 系统 中 是 否 存 在 物理 文件 时 ， 默 不 作 声 即 可 。 但 当 你 在 意 时 ， 你 束 应 该 明确 表达 出 来 。 针 对 代码 清单 
5.9 中 例子 的 一 种 做 法 是 : 
GTest 
public void initializedWithMissingCatalog() throws Exception { 
withMissingFile(tempfile); 
ProductCatalog catalog = new XmlProductCatalog (tempfile); 


assertEquals(0, catalog.numberOfProducts()).; 


} 


private void withMissingFile(File file) { 
file.delete!(),， 
} 


明确 对 执行 环境 的 期 望 ， 除 了 能 确保 缺失 的 文件 不 存在 以 外 ， 还 有 助 于 表达 测试 的 意图 。 
5.5.3 小结 

与 文件 系统 打交道 的 测试 所 面临 的 问题 之 一 ， 是 由 于 文件 系统 是 被 所 有 测试 共享 的 资源 。 也 就 是 说 ， 如 果 一 个 测试 留 下 残留 
物 ， 而 下 一 个 却 假设 自己 面 对 着 空 目录 或 不 存在 的 文件 ， 那 么 测试 将 会 相互 影响 。 当 以 特定 顺序 运行 一 组 测试 时 ， 不 论 它 们 能 够 
偶然 地 成 功 ， 还 是 看 似 随机 地 失败 ， 全 都 不 是 我 们 想 要 的 结果 。[] 

要 避免 或 减轻 这 些 问题 ， 你 应 该 牢记 在 teardown 方 法 中 删除 任何 由 测试 生成 的 文件 。 你 应 该 避免 在 多 个 测试 中 使 用 相同 的 


文件 路 径 ， 这 将 大 大 降低 测试 残留 物 造 成 问题 的 概率 。 此 外 ， 通 过 明确 地 预期 文件 是 否 存 在 ， 你 能 极 大 地 改善 测试 的 可 读 性 和 可 
维护 性 。 





或 许 最 重要 的 一 一 这 能 确保 可 重复 性 一 一 你 应 该 完全 避免 使 用 物理 文件 ， 因 为 它们 根本 不 是 你 要 测试 的 对 象 。 
[1 尽管 JUnit 及 其 用 户 往往 避免 使 测试 依赖 于 顺序 ， 提 倡 隔离 和 独立 ， 然 而 另 一 个 流行 的 Java 测试 框架 


TestNG (http://testng.otg) 却 拥抱 有 序 测试 ， 允 许 程 序 员 显 式 地 将 指定 测试 声明 为 按照 指定 顺序 执行 。 


5.6 “沉睡 的 蜗牛 


比 起 处 理 内 和 存 中 的 数据 ， 使 用 文件 MO 是 极其 缓慢 的 。 再 说 一 志 ， 缓 慢 的 测试 是 影响 可 维护 性 的 主要 障碍 ， 因 为 不 论 是 添加 
新 功能 还 是 修复 问题 ， 程 序 员 在 修改 代码 时 都 需要 反复 地 运行 测试 。 


文件 |/O 并 非 绥 慢 测 试 的 唯一 来 源 。 通 常 对 测试 套件 执行 时 间 帝 来 的 更 大 冲击 是 源 自 大 量 的 Thread#sleep 调 用 ， 它 允许 其 他 


三 二 已, 


线程 先 完成 工作 ， 然 后 再 对 预期 结果 和 和 副作用 进行 断言 。 沉 睡 的 蜗牛 非常 容易 友 现 : 查找 Thread#sleep 调 用 以 及 留意 异常 缓慢 
的 测试 。 遗 憾 的 是 ， 授 脱 演 瞪 可 不 是 件 容 易 的 事 儿 。 话 里 如 此 ， 这 滩 浑 水 还 是 可 以 未 ， 也 值得 趟 。 


我 们 用 例子 来 深入 探讨 这 个 代码 坏 味道 以 及 恰当 的 除 具 剂 。 


5.6.1 示例 


由 于 线程 往往 会 增加 代码 的 复杂 性 ， 因 此 我 们 先 挑 一 个 相对 简单 的 例子 ， 但 仍 涉及 针对 并 发 访问 场景 中 行为 的 测试 。 代 码 清 
单 5.10 展 示 了 对 Counter 对 象 的 测试 ， 该 对 象 负 责 产 生 唯 一 的 数字 。 显 然 ， 即 使 多 个 线程 同时 调用 Counter， 我 们 也 希望 这 些 数 
字 是 独一无二 的 。 


代码 清单 2.10 ”对 访问 计数 器 的 多 线程 进行 测试 


aTest 
Public voild concurrentAccessFromMultipleThreads() throws Exception { 
final Counter counter = new Counter(); 


final int callsPerThread = 100: 


final Set<Long> values = new HashSet<Long>(); 
Runnable runnable = new Runnable!() ({ 
QOverride 
public void run() { 全 线程 在 循环 中 
for (int 1I = 0; i < callsPerThread; i++) { 增加 计数 此 


values.add(counter.getAndIncrement!()); 


} 


ye 


int threads = 10; 
for (int i = 0; i < threads; i++) { 和 启动 线 得 
new Thread (runnable) .start(): 


} 

Thread.sleep (500); 二 和 等 待 线程 结束 
int expectedNoOfValues = threads * callsPerThread; 9 检查 数值 的 
assertEquals (expectedNoOfValues, wvalues.size()); 唯一 性 


测试 所 做 的 工作 ， 先 是 人 建立 几 个 将 要 重复 访问 计数 器 的 线程 ， 然 后 启动 所 有 线程 。 由 于 测试 无 法 预知 线程 是 如 何 被 调度 


的 ， 以 及 何 时 会 结束 ， 于 是 我 们 全 调用 了 Thread#sleep， 令 测试 @ 在 每 次 断言 之 前 先 等 待 半 秒 。 


_ 


尽管 500 毫 秒 听 起 来 有 点 夸张 ， 但 其 实 并 不 是 的 。 就 算 睡 上 (sleep) 300 毫 秒 ， 在 我 的 计算 机 上 测试 大 约 也 会 有 10% 的 概率 
失败 一 一 那 正 是 我 们 讲 过 的 脆弱 的 测试 ! 

现在 ，500 毫 秒 的 sleep 仍 然 不 可 靠 ; 有 时 需要 更 久 的 时 间 才 能 让 全 部 线程 完成 工作 。 一 旦 是 因为 500 毫 秒 的 sleep 还 不 够 久 
而 导致 了 测试 失败 ， 程 序 员 就 会 延长 sleep。 毕 竟 ， 我 们 不 喜欢 脆弱 的 测试 。 


脆弱 绝对 是 大 问题 。 但 是 代码 清单 5.10 中 带 有 sleep 的 测试 还 有 另 一 个 问题 : 它 相当 得 慢 。[ 尽 管 500 毫 秒 听 起 来 不 多 ， 但 
是 积 少 成 多 啊 ， 尤 其 是 当 测试 代码 中 人 遍布 着 许多 Thread#sleep 的 时 候 。 


接 下 来 看 看 我 们 能 对 沉睡 的 测试 做 些 什么 。 


5.6.2 ”该 对 它 做 点 儿 什 么 


Thread#sleep 很 慢 ， 因 为 从 工作 线程 结束 到 测试 线程 知道 它们 结束 ， 这 之 间 存 在 时 间 延 迟 。 尽 管 有 时 候 线程 都 在 能 10 毫 秒 
之 内 完成 ， 但 有 时 候 它 也 会 消耗 几 百 毫秒 一 “甚至 更 多 一 “因此 就 算 某 些 等 待 是 不 必要 的 ， 我 们 每 次 还 是 不 得 不 等 上 几 百 训 
秒 。 





代码 清单 3.11 中 展示 了 一 种 更 好 的 方式 ， 蔡 换 掉 了 奢侈 和 不 可 靠 的 Thread#sleep。 最 根本 的 不 同 在 于 我 们 使 用 了 
java.util.concurrent 包 中 的 同步 对 象 ， 使 得 测试 能 够 立即 知晓 工作 线程 的 任务 结束 了 。 


代码 清单 5.11 不 带 sleep 去 测试 多 线程 访问 


a&Test 
PUublic Void concurrentAccessFromMultipleThreads() throws Exception 1 


final Counter counter = new Counterl(}: 


final int numberofThreads = 10; 要 
final CountDownLatch allThreadsComplete = -人 同步 镶 
mew CountDownLatch (numberOfThreads):; 


final int callsPerThread = 100 : 
final Set<Long> Vvalues = new HashSet<Long> |(); 
Runnable runnable = new Runnablel() 1 
QOverride 
public void run() 1 
for (int 1 = 0; 1 < callsPerThread; 1++) { 
values.add (counter.getAndIncrement ()).; 


) 9 将 线程 标 i 
allThnreadsComplete.countDown|():; < 为 完成 


全 


for (int i = 0;: 1 < numberoOfThreads; 1i++) ( 
new Threadlrunnable) .start(): 


} 上 a 丰 站 i | ， ee 
9 等 待 线程 完成 
allThreadsComplete.await (10, TimeUnit .SECONDS).; 要 


int expectedNoOfValues = DurrberoOtThreaas * callsPerThread; 
assertEdquals (expectedNoOfValjues, Vvalues.sizel)): 


代码 清单 5.11 中 强调 了 关键 的 区 别 。 这 个 方案 的 核心 就 是 人 @ 同 步 对 象 ， 用 来 在 工作 线程 和 测试 线程 之 间 协 调 。 先 是 初始 化 一 
个 CountDownLatch 来 为 工作 线程 的 数量 计数 ， 每 个 工作 线程 一 旦 完成 工作 就 触发 锁 存 器 (latch) 一 次 。 所 有 工作 线程 启动 
完毕 后 ， 测 试 就 全 等 待 同步 锁 。 调 用 CountDownLatch#await 开 始 阻塞 ， 直 到 所 有 线程 都 通知 完成 ， 或 者 已 经 超时 。 


在 这 个 机 制 下 ， 当 工作 线程 完成 后 ， 测 试 线程 就 立即 唤醒 并 执行 断言 。 没 有 不 必要 的 sleep， 也 无 需 怀 疑 500 宫 秒 对 所 有 线 
程 完 成 是 否 足够 长 。 
5.6.3 ”小 结 


沉睡 的 蜗牛 指 迟 缓 的 测试 ， 运 行 起 来 没完 没 了 (相对 而 言 ) ， 因 为 它 依赖 于 Thread#sleep， 为 了 让 所 有 线程 执行 完毕 ,， 需 
要 在 执行 断言 或 继续 工作 之 前 等 待 很 信 。 这 个 坏 味 道 产 生 于 线程 调度 和 执行 速度 的 不 同 ， 意 味 着 sleep 的 时 间 必 须要 比 线程 所 需 


时 间 长 许多 才 行 。 所 有 这 些 sleep 的 等 待 时 间 加 起 来 ， 会 使 测试 变 得 很 慢 。 


该 方案 基于 一 个 简单 的 想法 ， 即 每 个 工作 线程 结束 后 应 当 通 知 测试 线程 ， 从 而 解决 了 这 个 坏 味道 。 只 要 测试 线程 得 到 这 个 信 
息 ， 测 试 就 可 以 立即 继续 自己 的 工作 ， 基 本 上 可 免 了 随意 添加 Thread#sleep 带 来 的 不 必要 等 待 。 


代码 清单 5.11 的 方案 建立 在 Java AP| 中 的 标准 同步 对 象 CountDownLatch 上 。Count-DownLatch 有 效 地 确保 仅 当 指定 的 线 
程 数 量 触 上 友 了 锁 才 能 执行 测试 。 如 果 你 的 系统 要 处 理 线 程 ， 那 么 给 自己 一 次 机 会 ， 投 入 工具 类 java.util.concurrent 包 的 怀抱 
吧 。 


现在 ,我 们 离开 多 线程 ， 去 看 看 另 一 个 完全 不 同 的 事情 一 一 束 像 是 强迫 症 的 单元 测试 。 我 想 这 需要 一 些 解 释 ， 我 们 去 看 看 
吧 。 


[1 假设 代码 平均 要 运行 100 毫秒 结束 ， 那 么 我 们 已 经 使 测试 变 慢 了 400%。 


5.7” 像 系 完 美 
像素 完美 是 基本 断言 和 魔法 数字 的 特例 。 把 它 放 在 这 个 坏 味道 分 类 中 ， 是 因为 我 觉得 它 在 计算 机 绘图 领域 频繁 出 现 ， 那 里 的 
人 们 经 常会 说 在 测试 中 遇 到 困难 。 


基本 上 ， 像 素 完美 坏 味道 出 现 的 场景 包括 ， 测 试 要 求 期 性 和 实际 产生 的 图 像 完 美 地 匹配 ， 或 者 期 望 在 产生 的 图 像 中 ， 指 定 坐 
标 处 的 像素 包含 某 种 颜色 。 这 样 的 测试 是 出 了 名 的 脆弱 ， 通 单 很 小 的 输入 变化 都 会 导致 测试 失败 。 


让 我 用 上 自己 10 年 前 工作 过 的 例子 来 审视 一 下 这 个 反 模式 。 
5.7.1 示例 


很 久 以 前 ， 我 工作 在 一 个 Java 应 用 程序 上 ， 它 人 允许 用 户 操作 屏幕 上 的 图 表 ， 在 画布 上 拖 放 长 方形 并 用 各 种 线段 连接 起 来 。 如 
果 你 用 过 任何 一 种 可 视 化 图 表 工 具 ， 你 大 概 会 知道 我 的 工作 是 做 什么 。( 图 5.1 简 单 地 展示 了 我 的 代码 从 对 象 图 所 产生 的 图 表 ， 
其 中 包含 各 种 长 万 形 和 线段 。 





图 5.1 两 个 长 方形 应 该 用 一 根 直 线 连接 起 来 


我 写 的 测试 精心 地 定义 了 长 方形 边框 看 起 来 的 样子 ， 以 及 包含 单词 foo 的 长 方形 是 多 少 像素 宽 ， 等 等 。 许 多 测试 由 于 严重 的 
像素 完美 而 深 受 其 害 。 其 中 一 个 特别 有 趣 的 测试 与 连接 两 个 长 方形 有 关 ， 有 后 像 图 5.1。 我 在 代码 清单 5.12 中 重 现 了 当初 写 的 测 
试 。 


代码 清单 3.12 ”极度 脆弱 的 测试 ， 精 确 地 断言 像素 的 位 置 和 颜色 


Public class RenderTest { 
&Test 
public volid boxesAreConnectedWithALine() throws Exception { 
BOX Doxl] = new Box(20, 20); 
Box box2 = new Box(20, 20); 
boxl .connectTo (Dox2 ) :; 


Diagqram diagram = new Diagram!(): 
diagram.add (boxl, new Point (10, 10)); 
diagram.add (box2, new Point (40, 20)); 


BufferedImage image = render (diagram): 
assertThat (colorAt (image, 19, 12)}, is (WHITE)).,; 
assertThat (colorAt (image, 19, 13)}, 1is (WHITE)).; 
assertThat (colorAt (image, 20, 13 1s (BLACK) ); 
assertThat (colorAt (image, 21, 13 1s (BLACK) ) ; 
assertThat (colorAt (image, 22, 14), is(BLACK)); 
assertThat (colorAt (image, 23, 14 1s8 (BLACK)); 
assertThat (colorAt (image, 24, 15 1s (BLACK 


( ( ) ) 
( ( ) ( ) ) 
l l ) ( ) ) 
( ( ) ( ) ) 
( ( ) ( ) ) 
l ( ) ( ) ) 
( ( ) ( : 
assertThat (colorAt (image, 25, 15), 1is(BLACK)}).; 
l l ) l 本 时- 
| 
( ( ) ( ) ) 
l l ) l ) ) 
l l ) ( ) ) 
( | ) ( ) ) 
( ( ) ( ) ) 


assertThat (colorAt (image, 26, 15 1s (BLACK 
assertThat (colorAt (image, 27, 16 1s (BLACK) ) ; 
assertThat (colorAt (image, 28, 16), is(BLACK)); 
assertThat (colorAt (image, 29, 17 1s8 (BLACK)).; 
assertThat (colorAt (image, 30, 17 1s (BLACK) ); 
assertThat (colorAt (image, 31, 17 1s (WHITE 
assertThat (colorAt (image, 31, 18 1s (WHITE 


首先 ， 代 码 清单 5.12 中 的 测试 难以 验证 。 我 是 说 ， 我 怎么 知道 (23，14) 处 应 该 有 一 个 黑色 像素 ”此 外 ， 不 难看 出 这 个 测 
试 是 多 么 容易 打破 。 任 何 图 表 边 界 宽 度 的 变化 ， 例 如 线段 的 精确 位 置 稍 有 偏 移 ， 测 斌 就 会 打破 。 这 是 不 好 的 ， 因 为 测试 检查 的 是 
图 表 中 两 个 相连 的 长 方形 是 否 也 可 见地 连 在 一 起 ， 而 长 方形 的 样子 不 应 该 影响 测试 。 


如 果 我 们 测试 长 方形 的 总 泻 染 宽度 ， 我 们 可 以 用 魔法 数字 来 对 付 这 个 问题 ， 用 类 似 
boxContentWidth+ (2*boxBorderWidth) 的 变量 组 成 断言 ， 来 包容 边界 宽度 的 变化 。 但 是 对 于 两 个 长 方形 之 间 的 线段 ,我 
们 的 做 法 没有 那么 显而易见 


么 ,我 们 能 做 些 什么 ? 


5.7.2 ”该 对 它 做 点 儿 什么 


用 适当 的 抽象 层次 来 表达 测试 ， 这 是 编写 它们 的 目标 之 一 。 如 果 你 对 两 个 长 方形 相互 连接 感 兴趣 ， 你 不 该 考虑 像素 或 坐标 。 
相反 ， 你 应 该 考虑 长 方形 ， 以 及 它们 是 否 相 连 。 简 单 吗 ? 


这 融 是 况 ， 不 要 用 基本 上 断言， 而 是 应 该 将 背后 的 细 术 末节 隐藏 到 目 定 义 断 言 中 ， 那 里 才 是 适合 的 抽象 层次 。 同 时 也 意味 痢 ， 
相对 于 精确 的 值 与 值 比较 ， 断 言 中 反而 需要 进行 模糊 匹配 种 实际 的 算法 。 





考虑 到 这 一 点 ， 我 们 可 以 重 写 代码 清单 3.12 中 的 测试 ， 将 检查 两 个 长 万 形 是 否 连接 的 细节 委托 给 目 定 义 断 言 。 目 定义 断言 
操心 如 何 检查 (最 好 是 以 灵活 和 健壮 的 方式 ) 。 代 码 清单 ?.13 展 示 了 该 测试 。 


代码 清单 3.13 ”灵活 的 测试 会 在 适当 的 抽象 层次 上 进行 表达 


public class RenderTest 1 
private Diagram diagram; 


Test 

public void boxesAreConnectedWithALine(}) throws Exception 1 
Box boxl = new Box(20, 20); 
Box box2 = new Box(20, 20); 
boxl .connectTo (box2); 


diagram = new Diagram(); 
diagram.add (boxl, new Point(10, 10)); 
diagram.add (box2, new Point (40, 20)); 


assertThat (render (diagram), 
hasConnectingLineBetween (boxl, box2)); 


private Matcher<BufferedImage> hasConnectingLineBetween I 
final Box boxl, final Box box2) ({ 
return new BoxConnectorMatcher (diagram, boxl, box2); 


} 


/:/: rest of details omitted for now 


代码 清单 5.12 和 代码 清单 5.13 的 主要 区 别 在 于 ， 将 大 量 看 似 任意 坐标 上 的 像素 颜色 测试 替换 掉 ， 代 之 以 口语 化 的 目 定 义 断 言 
一 一 在 两 个 长 万 形 之 间 应 该 有 一 条 连接 线段 。 可 读 性 变 得 好 多 了 ， 而 且 这 个 特殊 的 测试 需要 的 维护 工作 更 少 。 


然而 ,复杂 性 没有 完全 消除 挥 。 我 们 仍然 需要 告诉 计算 机 如 何 辨 别 两 个 长 方形 是 人 否 相 连 ， 而 那 正 是 神秘 的 


BoxConnectorMatcher 的 职责 。 


BoxConnectorMatcher 的 实现 细节 看 似 与 要 介绍 的 这 种 测试 坏 味 道 没 喻 关系 。 毕 竟 ， 这 是 一 个 特殊 情况 的 方案 。 但 是 因为 
许多 程序 员 似乎 都 对 图 形 相关 代码 的 可 测 性 失去 了 信心 ， 因 此 我 觉得 仔细 看 看 其 实现 还 是 有 必要 的 。 


ee 责 声明 之 后 ， 代 码 清 单 5.14 港 露 了 一 种 实现 BoxConnectorMatcher 的 细节 ， 即 使 长 方形 的 相关 位 置 变动 了 一 个 像素 ， 这 
种 智能 断言 也 不 会 被 打破 。 


代码 清单 5.14 ”用 自 定义 的 匹配 器 来 检查 两 个 长 方形 之 间 的 连接 


DUbD1ic class BoxConnectorMatcher extends BaseMatcher<BufferedImage> { 
private final Dlagram dlagram; 
private final Box boxl; 
private final Box box2; 


BoxConnectorMatcher (Dlagram diagram, Box boxl, Box box2) { 
this.diagram = diagram; 
this.boxl = boxl:; 
this.box2 = box2; 

} 


QOverride 

public boolean matches(Object oo) 【 

BufferedImage image = (BufferedImage) 口 ; 

wn er 

Point start = findEdgePointFor (boxl)}.,; 和 定位 边 绿 像 系 

Point end = findEdgePointFor (box2).; 

return new PathAlgorithm(image) -和 委托 ! 
.areConnectedlstart, end)., | 

} 


private Point findEdgePointFor(final Box boxl) 1{ 
Point a = diagram.positionof (boxl). 
int x = a.xX + {boxl .width() / 2); 
int y = a.y - (boxl .height() / 2); 
return new Point (x, yy); 


} 


EOverride 
Public void describeTo(Description da) 人 
.appendText ("connectiing line exists between " 
+ boxl + " and " + box2):; 


BoxConnectorMatcher 的 精华 都 在 matches0 方 法 中 ， 首 先 @ 分 别 找 出 两 个 长 方形 的 任意 一 个 边缘 点 ， 然 后 委托 给 人 @ 
PathAlgorithm (路 径 算法 ) 对 象 ， 来 判定 两 个 坐标 是 否 在 图 中 相连 。 


接 下 来 代码 清单 5.15 是 PathAlgorithm 的 实现 。 警 告 ， 这 是 一 段 元 长 的 代码 ， 我 不 打算 细致 地 解释 。 


代码 清单 5.15 “PathAlgorithm 负 责 查 找 两 个 像素 之 间 的 路 径 
public class PathAlgorithm 1{ 
private final BufferedImage 1img:; 
Drivate Set<Point> visited:; 
Brivate 1int lJineColor: 


public PathAlgorithm(BufferedImage image) 1 
this.img = 工科 二 可 已; 


public boolean areConnected(Point start, Point end) 上 
Visited = new HashSet<Point>!(): 


站 


lJineColor = 1Lmg. 避 etRGBEIS 上 taLrt .x, start .vy).; 
return areSomehowConnected (start, end)}: 


} 


private boolean areSomehowConnected(Point start, Point end) 【 
visited.add (lstart}):; 
if (areDirectlvyvConnected(start, end})}) return true: 
for (Point next : UnvisitedNeighborsOf (start)})}) 1 
lf (areSomehowConnectedlinext, end)}) return true; 
} 
return false; 


} 


private List<Point> unvisitedNeighborsof (Point p}) { 
List<Point»> neiaohbors = new ArravDList<Point>():; 
for (int xDiff = -1; xDiff <= 1; xD1iff++} 1 
for (nt wvDiff = -=1; yDiff <= 1,; VDILEE++) { 
Polnt neighbor = new PolLnt(P.X + xDiff, py + yDiff):; 
ift (!isWithinImageBoundary (neighbor)) continue; 
int pixel = img .getRGB (neighbor.x, nelghbor.Yy); 
if {pixel == lineColor && lVvislted.contains (neighbor)}} { 
neighbors.add (neighbor).; 


return neighbors:; 


} 


private boolean isWithinImadgeBoundary (Point p) 1 
jf (BpB.X < py < 0) return false; 
if (了 .其 >= img .getWidth(}} return false; 
if (pp.v >= img.getHeiaght(}) return false:; 
rTecuUrn 下 于 也 人 


} 


private boolean areDirectlyConnected (Point start, Point end) 1 
Int xDistance = abs(lstart.xX -= end.x); 
int vyDistance = abs(start.y - end.y); 
return xDistance <= 1 && vDistance <= 1; 


PathAlgorithm 的 实现 其 实 融 是 深度 优先 搜索 ， 从 起 始 坐标 开始 ， 遇 历 每 个 颜色 符合 的 相 邻 坐标 ， 直 到 走 完 所 有 相连 的 点 ， 
或 者 遇 到 与 终止 坐标 直接 相 邻 的 点 。 


S73 des 


像素 完美 : 顾名思义 ， 是 一 种 特定 于 图 形 和 图 像 生成 的 测试 坏 味道 。 它 混杂 了 魔法 数字 和 基本 断言 ， 使 得 测试 极 难 阅读 也 极 
其 脆弱 。 


这 种 测试 几乎 无 法 阅读 ， 因 为 即使 测试 在 语义 上 是 处 于 高 层 概念 的 ， 却 仍然 会 针对 硬 编码 的 底层 细节 例如 像素 坐标 和 颜色 来 
进行 断言 。 指 定 坐 标 上 的 像素 是 黑 还 是 日 ， 与 两 个 图 形 是 人 否 相连 或 堆 堵 的 概念 是 有 区 别 的 。 


这 种 测试 极其 脆弱 ， 因 为 即使 很 小 的 和 不 相关 的 输入 变化 一 一 是 否 是 另 一 个 图 像 ， 或 图 形 对 象 的 泻 染 方 式 一 一 都 足以 影响 
输出 、 打 破 测 试 ， 谁 让 你 非 要 精确 地 检查 像素 坐标 和 颜色 呢 。 同 样 的 问题 在 采用 golden masterl 人 技术 时 也 会 遇 到 ， 其 做 法 是 事 
先 将 图 像 录 制 下 来 ， 并 手工 检查 其 正确 性 ， 以 后 再 进行 测试 时 就 将 演 染 出 的 图 像 与 之 进行 比 对 。 

这 些 可 不 是 我 们 愿意 去 维护 的 测试 。 我 们 不 希望 带 着 这 种 脆弱 的 精确 度 去 编写 测试 ， 而 是 使 用 模糊 匹配 和 智能 算法 来 代替 繁 
琐 的 数值 比较 。 


在 5.7.2 世 的 示例 万 案 中 ， 我 们 可 以 在 适当 抽象 层次 上 针对 表达 意图 的 图 像 输 出 来 编写 断言 一 一 针对 高 层 概念 而 非 像素 坐 
标 。 但 你 也 看 到 了 ， 这 种 目 定义 断言 实现 起 来 并 不 容易 。 无 论 如 何 ， 考 虑 到 像素 完美 的 极 硫 脆弱 性 时 ， 这 样 做 还 是 物 有 所 值 的 。 


目前 你 见 到 的 大 多 数 测试 坏 味 道 无 疑 都 是 不 好 的 ， 你 应 该 赁 经 验 来 避免 。 下 一 个 坏 味道 不 太一 样 ， 它 其 实 是 好 事变 坏事 。 


[1 只 是 我 的 看 起 来 很 丑 陆 ， 这 是 实话 。 
[2] 捕获 并 保存 当前 的 处 理 结果 ， 未 来 的 运行 结果 将 会 与 保存 的 结果 进行 对 比 ， 从 而 发 现 预 期 之 外 的 变更 。 又 称 Apptove Test 或 标 
杆 比 对 测试 法 。 参 见 http://blog.codeclimate.com/blog/2014/02/20/gold-mastet-testing/。 





译 者 注 


5.8 ”人参 效 化 混乱 


作为 专业 程序 员 ， 我 们 有 义务 去 学 习 更 广泛 的 技巧 和 技术 ， 提 高 开发 软件 的 能 力 。 其 中 一 些 技巧 是 如 此 强大 ， 以 至 于 我 们 往 
往 过 度 地 使 用 ， 比 如 我 们 总 是 寻找 一 个 生僻 的 机 会 或 理由 来 运用 刚刚 得 到 的 、 最 新 最 好 的 工具 。 在 单元 测试 特别 是 JUnit 4 的 上 
下 文中 ， 参 数 化 测试 模式 是 最 常 过 度 使 用 的 技术 之 一 。!"] 
参数 化 测试 模式 
参数 化 测试 模式 是 一 种 方法 ， 从 大 同 小 异 的 面向 数据 的 测试 中 去 除 重复 。[ 例如 现在 存在 某 个 测试 类 ， 其 中 13 个 测试 方法 的 


唯一 区 别 就 是 被 测 代码 的 简单 输入 输出 值 有 所 不 同 。 假 设 代 码 输入 一 个 int， 返 回 一 个 Stting。 


你 应 该 将 此 测试 类 转化 为 参数 化 测试 ， 将 一 些 样 板 代码 (boilerplate) 委托 给 测试 框架 本 身 ; 你 会 在 5.8.2 节 中 见 到 一 个 具体 
例子 。 


我 们 有 许多 选择 来 保持 测试 代码 整洁 和 易于 维护 ， 若 测试 数据 无 法 在 运行 期 之 前 明确 下 来 ， 这 时 参数 化 测试 模式 确实 具有 其 
他 万 法 不 可 比拟 的 优势 ， 当 然 这 种 情况 很 少 出 现在 单元 测试 中 。 


参数 化 测试 是 一 种 恨 好 的 模式 ， 但 是 在 错误 的 上 下 文中 过 于 急切 地 使 用 ， 参 数 化 测试 束 变 成 了 一 种 坏 味 道 
乱 ， 它 难以 理解 ， 而 且 当 某 个 测试 失败 时 难以 定位 实际 错误 。 


参数 化 混 





5.8.1 示例 


先 看 一 个 通常 会 重 构 为 参数 化 测试 模式 的 例子 ， 然 后 以 此 来 探讨 这 个 代码 坏 味道 。 一 般 来 况 ， 正 是 代码 清单 3.16 中 的 情形 促 
使 它 转 为 参数 化 测试 。 


代码 清单 5.16 ”参数 化 测试 模式 的 典型 起 始点 


Public class RomanNumeralsTest { 


@Test 

public void one() { 
assertEquals("I", 

上 


@Test 

public wvoid twol(l} { 
assertEquals(l"IIl", 

上 


全 TeESt 

public woid four(} { 
assertEdquals("IV", 

} 

六 T'est 

public wvoid fiwvel{(} + 
assertEquals ("VvV", 

} 


TeéSt 


public void seven(}) { 
assertEdquals(" VIII", 


} 


BTest 

public void nine(} 1{ 
assertEquals ("IX", 

} 

Test 

public void ten(} 1 
assertEquals ("XX", 


该 代码 清单 中 包含 一 堆 只 有 一 行 的 测试 方法 ， 仪 仪 是 输入 和 期 性 输 出 值 有 所 不 同 。 被 测 代码 是 个 工具 类 ， 负 责 将 


为 罗马 数字 。 


format(1li})}): 


format (2)): 


format (4)): 


format (S}):; 


format (9)):; 


format (10) ) ; 


format (7) ) ; 


这 种 情形 正 是 参数 化 测试 模式 的 用 武之 地 ， 其 降低 代码 行 数 的 手段 主要 是 去 除 样板 代码 (boilerplate) ， 也 瓯 是 目前 代码 


清单 5.16 中 的 测试 方法 签名 。 


代码 清单 5.17 中 使 用 参数 化 测试 模式 和 JUnit 的 Parameterized test runner (测试 


代码 清单 .17 参数 化 测试 模式 减少 样板 代码 


一 /一 


运行 


器 ) 重 写 了 相同 的 测试 。 


@RunWith(Parameterized.class) 二 和 特殊 的 test runner 
PUblic class RomanNumeralsTest 1{ 

Private 1int number:; 

private String numeral,; 


Public RomanNumeralsTest (int number, String numeral) | Ea 将 参数 保存 
this.number = number; 到 字段 中 
this,.numeral = numeral; 和 

和 

@Parameters 


public static Collection<Object[]> data(}) { 间 王 浏 计 的 
return asList(new Object[][] { { 1, "I* }, { 2, "II" }, We : 
这 参数 列表 
上 I TIX {0 x" } Ys 


测试 使 用 

色 Test 
于 时 用 时 6 Mr 指 本 i 段 
PuUDLIC Vold formatsPositivelIntegers() 1 ee 


assertEdquals (numeral, format (number)):; 


JUnit 内 置 的 参数 化 测试 实现 机 制 很 简单 。 我 们 @ 需 要 告诉 JUnit 用 Parameterized test runner 来 执行 测试 类 。 当 
Parameterized test runner 接 管 以 后 ， 它 查找 一 个 带 有 @Parameters@ 注 解 (annotation) 的 、 无 参数 的 public static void 
方法 。 该 方法 会 返回 一 串 参 数 ， 即 不 同 的 数据 ， 包 括 测试 所 需 的 输入 和 期 望 的 输出 。test runner 会 志 历 这 些 数据 ， 每 次 为 一 组 
参数 实例 化 一 次 测试 类 ， 将 合 参 数 传 入 构造 函数 并 保存 在 私有 字段 中 。 最 后 ， 真 正 的 测试 方法 全 使 用 保存 在 私有 字段 中 的 夹具 来 
执行 断言 。 





\ 


这 种 参数 化 实例 的 问题 可 归结 为 在 两 种 可 读 性 挑战 之 间 寻 求 平衡 。 代 码 清单 5.16 中 我 们 看 到 ， 样 板 代 码 会 导致 难以 看 清 牛 肉 
一 一 每 个 测试 方法 中 的 那 唯一 一 行 代码 。 代 码 清单 5.17 中 ， 我 们 减少 了 1/3 的 纯 代 码 行 数 ， 但 是 反 过 来 ， 现 在 却 引 入 了 一 个 列表 
套 着 询 表 的 姿 乱 语法 ， 变 得 繁琐 起 来 。 当 参数 数量 和 复杂 性 增加 ， 以 及 列表 变 得 越 来 越 长 时 ， 问 题 才 会 恶化 。 例 如 ， 代 码 清 
5.18 中 是 我 在 某 个 开源 会 计 软 件 中 找到 的 测试 数据 集 。 


代码 清单 3.18 参数 越 多 ， 越 难 理解 和 修改 


QParameters 
public static List<Object[]> getData() { 
return asList(new Object[][] { 
{ SCHEDULE FREQUENCY_EVERY_DAY .toString(), 
getDate(2007, JANUARY, 1), getDate(2007, JANUARY, 31), 
getDate(2007, FEBRUARY, 1), -31001 }, 


{ SCHEDULE FREQUENCY_EVERY_DAY .toString(), 
getDate(2007, JANUARY, 1), getDate(2007, JANUARY, 31), 
getDate(2007, MARCH, 1), -31001 }, 

{ SCHEDULE FREQUENCY_ EVERY_ WEEKDAY .toString(), 
getDate(2007, JANUARY, 1), getDate(2007, JANUARY, 31), 
getDate(2007, FEBRUARY, 1), -23001 }, 

{ SCHEDULE FREQUENCY_ BIWEEKLY .toString(), 
getDate(2007, JANUARY, 1), getDate(2007, JANUARY, 31), 
getDate(2007, FEBRUARY, 1), -2001 }, 

{ SCHEDULE FREQUENCY_ EVERY_ WEEKDAY .toString(), 
getDate(2007, JANUARY, 1), getDate(2007, JANUARY, 31), 
getDate(2007, FEBRUARY, 1), -23001 }, 


好 消息 是 ， 那 仍然 是 代码 ， 我 们 就 可 以 用 常规 手段 令 @Parameters 方 法 更 加 容易 访问 。 然 而 还 存在 另 一 个 难以 解决 的 问 


立 
oo 


图 5.2 显 示 ，Eclipse test runner 报 告 了 代码 清单 5.17 中 某 个 测试 用 例 的 失败 。 由 Parameterized test runner 动 态 生 成 的 测 
试 实际 上 是 匿名 的 ， 除 了 运行 期 编号 没有 任何 其 他 标签 。 


人 Wee 山 介 旧 9 Q, A EE = 


目 Errors: 0 日 Failures: 





的 parameterized.RomanNumeralsParameterizedTest [Runner': JUnit 4] (0.001 5) 
> 上 [0] (0.000 5) 
ee 此 日 [1] (0.000 s) 
> 上 [2] (0.000 5) 
> 上 [3] (0.000 5) 
> 上 [4] (0.000 5) 
区 [5] (0.000 5) 
的 [6] (0.001 5) 
二 formatsPositiveintegers[6] (0.001 5) 





三 Failure Trace : Ee 
J org.junit.ComparisonFailure: expected:<[X}> but was:<[IXI]> 








三 at parameterized.RomanNumeralsParameterizedTest.formatsPositiveIntegers(RomanNumeralsParameterizedTest.java:32) 





图 5.2 ”参数 化 测试 实际 上 是 匿名 的 ， 使 得 测试 结果 难以 解读 


没有 可 识别 的 名 字 或 标识 竺 ， 当 其 中 一 个 测试 失败 时 殉难 以 确定 到 底 是 哪个 失败 了 ; 仅 有 的 有 用 信息 融 是 断言 失败 的 消息 。 
本 例 中 ， 错 误 消 息 恰 好 包含 足够 细节 来 定位 失败 的 测试 用 例 。 但 如 果 我 们 比较 了 多 个 值 ， 我 们 融 只 能 知道 整个 数据 集中 的 某 一 个 
变量 出 现 了 不 同 。 


现在 我 指出 了 参数 化 测试 的 某 些 不 足 ， 它 们 会 导致 代码 坏 味 道 和 可 维护 性 问题 ， 那 咀 们 谈 谈 对 那些 问题 有 什么 可 以 做 的 。 
5.8.2 ”该 对 它 做 后 儿 什 么 


你 可 能 听 过 一 个 人 对 医生 抱怨 的 笑话 ，“ 这 样 动 我 的 用 膊 会 疼 ”， 医 生 回答 说 ，“ 那 束 别 动 ”。 这 也 是 针对 参数 化 混乱 的 最 
简单 的 解决 方案 。 


数 化 测试 最 终 市 来 的 只 是 日 头 友 和 办 公 室 中 的 俏皮 话 ， 那 么 采用 参数 化 测试 模式 就 要 三 思 而 后 


有 上 鉴于 此 ， 而 且 看 到 这 么 多 参 
案 是 将 多 个 测试 用 例 封 浴 到 一 个 测试 万 法 中 ， 从 而 减少 代码 清单 5.16 中 到 处 散落 的 样板 代码 。 


行 。 例 如 ， 可 选 的 解决 万 


public class RomanNumeralsTest { 


GTest 

public void formatsPositiveIntegers() { 
aSSeLrtEdcuals ("I", format (1) ) ; 
agsertEouals CILI 十 OIL a)}s: 
assertEquals("IV", format (4) ) ; 
aSSertEduals ("V"，ftormat (5) ) ; 
aSSeLrtEduaJlLs ("VII" ， format (7)); 
assertEquals ("IX", format (9) ) ; 
assertEquals("X", format (10) ) ; 


} 


前 面 已 经 说 过 ， 当 你 决定 采用 参数 化 测试 模式 时 ， 你 可 以 做 一 些 简单 的 事情 来 避免 难以 阅读 的 数据 ， 以 及 难以 识别 的 匿名 测 
试 失败 。 兽 先 关 注 于 简化 测试 数据 ， 使 之 更 加 弄 眼 。 


代码 清单 2.17 的 可 读 性 问题 ， 基 本 上 可 以 归结 到 那 一 长 串 匿 名 数据 。 


new Object[][] lo le™ oj Bs EE™ Be tC Be EM 


EE 二 { 
{ Db nnn 下 { nrTT" > { “ Te bp; { 二 总， ne } } 


要 让 这 种 多 级 结构 易于 理解 ， 你 需要 找到 一 种 方式 使 参数 集 彼此 分 


分 离 。 最 简单 的 方式 是 将 它们 一 个 一 个 地 加 到 列表 中 ， 而 不 
是 使 用 内 联 的 数组 声明 风格 ,但 是 那 也 会 市 来 尽量 要 避免 的 喝 唆 和 重复 。 


你 也 可 以 缩 进 列表 ， 这 样 每 个 数据 集 都 呆 在 自己 的 行 中 ， 但 是 那样 的 话 你 就 不 能 使 用 IDE 的 自动 格式 化 功能 了 。| 


另 一 个 值得 考虑 的 方案 可 能 需要 用 varargs (可 变 参数 ) 方法 将 每 个 数据 集 都 包 起 来 ， 比 如 : 


QParameters 
public static Collection<Object[]> data() { 
return aeLLSt (eet(l,. "TE"™), YX 
SE(D “TT Ay 
Set(t “IY*)}: 了 7 
Set(5, “WV”, XY 
set (7, SL 
SEE IT ZY 
set (10, "XxX")); 
} 
private static Object[] set (Object . .。 values) { 


return values: 


} 


这 里 我 们 做 了 两 件 事 。 首 先 ， 调 用 一 个 方法 来 蔡 换 挥 花 括号 ， 用 一 个 单词 Set 有效 地 将 每 个 参数 分 离 。 一 般 来 说 ， 这 是 一 个 
更 简单 的 视 洁 边界 差异 。 其 次 ， 我 们 在 每 个 数据 集 之 间 增 加 了 注释 ， 下 次 有 人 想 要 修复 代码 格式 时 可 以 防止 自动 格式 化 功能 的 
瑟 。 


现在 ， 参 数 化 的 问题 、 匿 名 测试 的 失败 、 不 清楚 测试 报告 中 的 “[123]” 指 的 是 哪个 数据 集 ， 对 于 这 些 问题 ， 你 能 做 些 什 
么 ”这 个 问题 源 自 JUnit 中 Parameterized test runner 的 实现 无 法 将 单个 测试 的 名 称 与 其 数据 集 关 联 起 来 。 因 此 你 需要 在 断言 的 
失败 消息 中 标明 测试 用 例 。 


GTest 
public void formatsPositiveIntegers() { 
assertEquals (dataset(), numeral, format (number)).; 


} 


private String dataset() { 
StringBuilder s = new StringBuilder () ; 
s.append("Data set: [") .append(this.number); 
s.append(", \"") .append(this.numeral) .append("\"]."); 
return 9.toStringtl)s 


你 可 以 用 类 似 @Parameters 方 法 中 的 方式 来 组 凌 一 个 失败 消息 ， 用 于 描述 整个 数据 集 ， 使 得 JUnit 在 测试 失败 时 能 表达 出 该 
信息 。 这 样 ， 即 使 test runner 的 层级 结构 仍然 不 能 通过 有 总 义 的 名 字 识 别 出 你 的 测试 ， 人 至少 你 手 里 还 有 这 个 大 招 儿 一 一 只 是 测 
试 失 败 信息 的 折 行 稍微 有 点 儿 长 。 





5.8.3 ”小结 


当 重 复 的 测试 仅仅 是 输入 和 输出 值 不 同时 ， 参 数 化 测试 模式 是 表达 它们 的 一 种 崇 凑 万 式 。 此 模式 涉及 的 领域 通常 包括 验证 、 
翻译 、 字 符 串 操作 ， 以 及 各 种 数学 计算 。 很 多 情况 下 ， 语 法 变 得 更 凌乱 ， 而 且 更 难 从 测试 失败 追踪 到 相应 数据 集 ， 这 些 实际 上 抵 
消 了 提高 简洁 性 所 市 来 的 改善 。 


如 果 你 决定 采用 参数 化 测试 ， 那 么 我 提供 三 种 方法 以 降低 该 模式 市 来 的 不 展 影 响 。 


为 了 帮 你 从 视 完 上 区 别 各 个 数据 集 ， 你 可 以 尝试 将 各 个 数据 集 封 闪 在 一 个 方法 调用 中 。 比 起 常用 来 构建 数据 集 列表 的 七 担 八 
垂 的 括号 ， 单 个 方法 调用 在 周围 代码 中 显得 更 加 醒目 。 


你 也 可 以 依靠 缩 进 来 将 数据 集 相 互 隔离 开 。 现 代 1DE 赋 予 你 强大 的 能 力 ， 自 动 地 根据 统一 风格 来 缩 进 和 格式 化 代码 。 这 在 维 
护 代 码 库 一 致 性 时 是 极其 有 用 的 ， 但 它 往往 也 会 破坏 掉 仔 细 地 手工 缩 进 的 列表 。 因 此 ， 你 可 以 为 每 行 添加 一 个 后 缀 注释 ， 来 防止 
1IDE 艇 掉 你 的 特殊 缩 进 。 


最 后 ， 由 于 JUnit 的 参数 化 测试 实现 无 法 让 你 从 执行 的 测试 退 踪 原始 数据 集 ， 你 需要 依赖 于 失败 断言 所 抛 出 的 消息 。 在 每 个 
新 言 消息 中 包含 用 到 的 整个 数据 集 ， 这 样 有 助 于 快速 定位 测试 场景 。 

这 些 步骤 每 个 都 能 节省 你 几 分 钟 ， 加 起 来 融 是 一 大 笔 财 富 。 我 们 的 下 一 个 坏 味道 也 是 一 样 ; 尽管 它 看 起 来 不 是 什么 大 事 ， 但 
水 滴 能 穿 石 啊 ， 而 且 我 们 程序 员 的 工作 不 束 是 确保 目 己 尽量 高 效 吗 ? 

参数 化 测试 模式 是 特定 于 测试 代码 的 ， 而 我 们 的 下 一 个 坏 味道 至 少 是 源 于 面向 对 象 代码 的 质量 度量 。 


[1 其 他 测试 框架 比如 TestNG 也 支持 这 种 模式 ， 但 都 没有 像 JUnit 这 般 广 泛 。 

[2] Getatd Meszaros. xUnit Test Patterns: Refactoting Test Code, Addison-Wesley, 2007。 

[3] 用 了 Eclipse 这 人 么 多 年 ， 我 养 成 了 一 个 习惯 ， 当 在 编辑 器 中 打开 一 个 源 文件 时 ， 都 不 自 党 地 要 按 下 格式 化 快捷 键 。 通 常 这 与 特 
殊 的 手动 缩 进 并 不 冲突 。 


5.9 “方法 目 缺 过 内 聚 





内 聚 是 构造 恨 好 的 面向 对 象 代码 的 主要 属性 。 简 而 言 之 ， 内 聚 意 味 着 一 个 类 只 代表 单一 事物 ， 单 一 抽象 。 内 聚 是 好 事 一 一 


我 们 希望 局内 聚 一 而 内 聚 也 是 一 种 代码 坏 味 道 。 


本 节 标 题 中 的 “万 法 间 ” 指 的 是 ， 我 们 通过 观察 一 个 类 中 各 方法 之 间 的 共性 来 确定 内 聚 度 。 尽 管 有 各 种 手段 来 计算 万 法 内 聚 
度 ,但 常见 公式 的 分 母 都 是 基于 一 个 大 概 的 想法 ， 即 完美 内 聚 意味 着 一 个 类 的 每 个 字段 都 被 每 个 方法 所 使 用 到 |。 


在 单元 测试 术语 的 上 下 文中 可 以 这 样 来 表述 ， 一 个 类 中 的 每 个 测试 都 使 用 相同 的 测试 夹具 。 相 反 ， 如 果 测 试 工作 在 不 同 的 夹 
具 上 ， 它 们 束 应 该 锌 重 构 为 更 多 的 测试 类 。 


接 下 来 看 看 这 个 坏 味 追 的 一 个 具体 例子 ， 然 后 讨论 这 个 源 于 缺乏 内 聚 的 实际 问题 。 
5.9.1 示例 


代码 清单 5.19 中 的 例子 来 自 于 某 个 开源 会 计 软 件 包 。(' 我 们 将 要 仔细 观察 的 代码 是 处 理 拆 分 会 计 的 ， 用 于 将 某 条 目的 成 本 分 
散 到 多 个 会 计 组 中 。 例 如 ， 新 的 数据 库 服务 器 将 被 三 个 不 同 部 门 使 用 ， 因 此 你 可 以 将 其 价格 分 拆 到 三 个 不 同 的 预算 中 。 


代码 用 三 个 领域 对 象 来 处 理 拆 分 会 计 操 作 : Account、split 和 BudgetCategory。 操 作 本 身 用 Transaction 对 象 来 表示 。 代 
码 清单 5.19 中 的 测试 类 在 @Before 方 法 中 为 这 些 领 域 对 象 初始 化 一 个 夹具 ， 然 后 测试 类 有 几 个 测试 方法 工作 在 那些 对 象 上 。 为 
了 简洁 ， 我 只 展示 其 中 两 个 测试 。 


代码 清单 2.19 ”测试 类 的 问题 在 于 各 方法 缺乏 内 聚 


public class SplitsTest { 


Account account.; 多 沾 夹 具 
split split:; 时 村 
BudgetCategory bcl, bc2, bc3, bod:; 


请 i 


TEsSt 
public volid fromSplits{(} throws Exception 1 
List<Transactlionsplit> fromSplits = 
new ArravyLlst<Transactionsplit>().: 
fromSsplits.add (createSsplit (bc3, 1200)):; 
fromSsplits.addlcreateSplit (bcd4, 34)):; 


Transaction 七 = createTransaction(split, account).; 
t .setFromSplits (fromSplits).:; 
assertTrue (transactions (七 ) .size() == 1); 
} 测试 只 用 
到 | 3 其 日 中 0 
&Test 此 夹具 


public void toSplits() throws Exceptlion { 
List<Transactlionsplit> toSplits = 
new ArrayLlist<TransactionSsplit>(}); 
tosplits.add (createSplit (bel, 1200})): 
toSsplits.add lcreateSplit (be2, 34)):; 


Transaction 七 = createTransaction(account, split): 
七 .setToSplits (toSsplits).:; 
assertTrue (transactions (七 ) .size() == 工 ) ; 


一 


切入 正题 。 代 码 清单 5.19 中 的 坏 味道 是 由 于 @@ 测 试 类 的 夹具 包含 了 多 个 BudgetCategory 对 象 ， 然 后 全 测试 方法 只 用 到 其 中 
一 部 分 。 这 明显 与 每 个 测试 都 工作 在 相同 夹具 上 的 想法 背道而驰 ; 各 个 测试 方法 缺乏 内 聚 。 


从 更 大 角度 来 看 ， 一 个 过 度 复杂 的 夹具 会 使 程序 员 更 难 理解 友 生 了 什么 。 更 多 的 字段 意味 着 你 的 大 脑 充 奈 着 更 多 变化 的 事 


单 看 其 中 一 个 测试 ， 其 实 也 很 难 找 出 它 用 到 了 哪些 字段 ， 因 为 不 够 明显 。 我 们 反而 留 下 疑问 ，“ 哪 个 category 也 是 bc3 来 
着 ? ”这 个 问题 源 于 一 个 基本 的 代码 坏 味 道 : 糟糕 的 命名 。 尽 管 测试 方法 缺乏 内 聚 并 不 会 令 你 完全 不 能 对 夹具 进行 尺 好 命名 ， 但 
往往 会 相当 困难 。 


例如 ， 每 个 测试 都 具有 一 个 输入 和 一 个 输出 ， 但 由 于 每 个 测试 都 有 这 人 么 一 对 儿 对 象 ， 你 丈 不 得 不 按照 emptylnput、 
inputWithOneThing、inputWithThreeldenticalThings 等 来 命名 。 这 样 ， 你 束 不 能 简单 地 看 着 夹具 说 : “ 没 错 。 这 两 个 是 一 
起 的 ， 而 剩 下 的 与 这 个 测试 无 天 。 


那么 这 种 情况 下 你 能 做 什么 ? 


5.9.2 ”该 对 它 做 操 儿 什么 


我 们 一 直 在 谈论 方法 缺乏 内 聚 ， 它 作为 一 种 度量 面向 对 象 的 指标 ， 与 测试 代码 的 上 下 文 密切 相关 。 它 也 像 我 们 在 第 4 草 讨论 
过 的 另 一 个 测试 坏 味道 。 那 个 坏 味 道 叫 做 人 格 分 缆 。 然 而 这 次 不 是 蛙 个 测试 万 法 遭受 任何 分 黎 之 痛 ， 而 是 整个 测试 类 在 遭 罪 。 


对 此 我 们 已 经 拿 出 了 一 个 对 策 一 一 将 类 分 拆 。 此 外 ， 更 好 的 典型 方案 是 强制 各 测试 使 用 相同 的 夹具 对 象 。 例 如 ， 你 可 以 看 
看 代码 清单 5.19 中 bc1、bc2、bc3 和 bc4 之 间 有 何 区 别 ， 是 否 应 该 去 掉 两 个 。 


有 时 那 仍 不 管用 ; 我 们 确实 需要 更 多 夹具 对 象 来 满足 不 同 的 测试 。 那 样 的 话 ， 最 好 还 是 寻找 合适 的 边界 将 类 分 拆 ， 比 如 图 
5.3 展 示 了 一 些 边界 。 问 题 是 ， 我 们 怎么 来 做 呢 ? 到 哪 去 找 分 拆 测试 类 的 线 床 ? 


共 孚 对 象 1 


测 弃 1 特有 测 芭 2 特有 


测 芭 2 特有 





图 5.3 ”要 将 一 个 测试 类 分 解 为 两 个 ， 我 们 需要 识别 哪 部 分 夹具 是 所 有 测试 共享 的 ， 哪 些 是 个 别 测 试 独 有 的 


例如 ， 你 在 代码 清单 3.19 只 看 到 了 两 个 测试 ， 但 在 该 类 其 余 的 测试 中 ， 没 有 哪个 用 到 两 个 以 上 的 BudgetCategory 对 象 ， 而 
且 bc1 和 bc2 忌 是 一 起 出 现 ， 要 么 bc3 和 bc4 一 起 出 现 。 你 应 该 寻找 这 类 和 群 组 ， 找 出 目 然 边界 从 而 将 类 分 拆 成 两 个 或 三 个 更 小 、 更 
专注 的 一 一 内 聚 的 一 一 测试 类 。 





有 时 你 需要 的 就 是 创建 另 一 个 测试 类 ， 将 某 些 方 法 和 夹具 对 象 搬移 过 去 ， 然 后 把 手 擦 干 净 。 通 党 ， 测 试 依赖 于 相同 的 工具 方 
法 ， 而 我 们 不 喜欢 重复 。 这 时 ， 我 们 也 需要 将 那些 工具 方法 移 到 单独 的 类 中 ， 如 此 一 来 ， 分 拆 后 的 测试 类 都 可 以 使 用 它 ， 或 者 提 
炼 一 个 公共 基 类 来 提供 这 些 工 具 。 后 一 种 方式 产生 的 测试 类 展示 在 代码 清单 5.20 和 代码 清单 53.21 中 。 





代码 清单 3.20 ”分 拆 测试 类 市 来 更 具体 的 夹具 和 更 高 的 内 聚 


public class TestSplitsAcrossDifferentBudgetCategories 
extends AbstractSplitsTestCase { 
private BudgetCategory incomeCategory, standardCategory.,; 


@QBefore 

public void setup() throws Exception { 
incomeCategory = new BudgetCategoryImpl ( ) ; 
incomeCategory.setIincome (rue) ; 
standardCategory = new BudgetCategoryImpl ( ) ; 
standardCategory.setIncome (false).; 


} 


@QOverride 
protected List<BudgetCategory> budgetCategories() { 
return asList(incomeCategory, standardCategory); 


} 


:7 teste Omitted 


现在 夹具 变 得 多 么 简单 。 这 个 测试 类 中 用 到 了 哪些 budget category 以 及 相互 之 间 的 区 别 都 一 目 了 然 。 将 所 有 公共 部 分 搬移 
到 抽象 基 类 AbstractSplitsTestCase 中 ， 融 可 以 做 到 这 一 点 ， 如 代码 清单 5.21 所 示 。 


代码 清单 5.21 抽象 基 类 服务 于 分 拆 后 的 测试 


public abstract class AbstractSplitsTestCase ({ 
protected Account account; 


QBefore 
public void initializeAccount(}) throws Exception { ... } 
/kk 
* Concrete test classes implement this to give the utility 了 
* methods access to the BudgetcCcategory objects in use. 目 
x 
protected abstract List<BudgetCategory> budgetCategories ( ) ; 
protected List<Transaction> transactions (Transaction t) 
throws ModelException { 
Document d = ModelFactory.createDocument  ().; 
for (BudgetCategory bc : budogetCategories(})) { 1] 来 自 上 共 体 子 类 
d.addBudgetCategory (bc).; 的 夹具 对 湿 
} 
d.addAccount (account): 
d.addTransaction(t}).; 
return d.getTransactions!().; 


} 


protected TransactionSsplit createSplit (BudgetcCcategory category, 
int amount) throws InvalidValueException { ... } 


protected Transaction createTransaction(Source from, Source to) 
throws InvalidValueException { ... } 


注意 这 里 需要 利用 abstract (抽象 ) 方法 从 具体 子 类 获得 实际 的 BudgetCategory@ 对 象 。 
继承 与 组 合 

这 里 我 们 借助 继承 来 达到 重用 ， 这 点 值得 商 权 。 继 承 毕 竟 暗 示 着 子 类 与 父 类 之 间 的 is-a 关 系 。 一 般 的 推荐 选择 是 组 合 优先 于 
继承 ; 即 通过 组 合 不 同 对 象 来 达到 重用 ， 而 不 是 通过 继承 关系 来 共享 数据 和 方法 。 

我 并 不 担心 你 到 处 使 用 抽象 测试 类 ， 但 是 你 可 能 会 过 度 使 用 继承 ， 所 以 在 向 你 的 测试 引入 抽象 基 类 之 前 要 三 思 。 你 要 面临 的 
风险 之 一 就 是 性 能 问题 ， 我 们 会 在 第 9 章 讨 论 。 

通过 将 测试 方法 中 的 小 群 组 搬移 到 专用 测试 类 中 ， 我 们 改善 了 缺乏 内 聚 的 问题 ， 现 在 每 个 测试 类 都 更 专注 于 特定 夹具 ， 不 再 
令 人 困 惑 。 我 们 决定 将 私有 方法 从 低 内 聚 的 庞然大物 中 提炼 成 公共 基 类 ， 来 避免 累 乾 。 
5.9.3 小结 


方法 间 缺 乏 内 聚 ， 意 味 痢 测试 类 中 的 方法 只 是 对 个 别 夹 具 对 象 感 兴 趣 。 


结果 残 是 程序 员 开 妈 或 修改 这 种 测试 时 ， 不 得 不 应 对 更 多 不 必要 的 变化 。 这 种 复杂 性 使 我 们 难以 弄 清 字段 是 什么 台 义 ， 测 试 
用 到 了 哪些 夹具 对 象 ， 哪 些 夹 具 又 该 放 人 在 setup 中 。 而 且 ， 数 十 个 测试 用 到 的 对 象 乙 间 仓 在 重 晋 ， 往 往 使 夹具 对 象 的 售 名 变 得 赵 
来 越 难 。 


所 有 这 些 问题 都 归结 为 一 个 简单 的 事实 : 那些 测试 不 属于 同一 个 测试 类 。 有 时 ， 腔 肿 的 测试 夹具 其 复杂 性 是 偶 友 的 ， 通 过 强 
制 各 个 测试 使 用 相同 的 夹具 对 象 ， 并 缩减 夹具 使 之 更 容易 管理 残 可 以 解决 问题 。 而 通常 ， 我 们 讨论 的 根本 复杂 性 并 未 一 一 也 不 
会 一 一 消失 。 





当 你 发 现 有 必要 存在 不 同 的 夹具 对 象 组 合 时 ， 通 党 有 两 重 针对 缺乏 内 聚 的 最 佳 补救 措施 : 
1. 将 测试 移动 到 不 同 的 测试 类 中 ， 并 且 (需要 的 话 ) 提炼 公共 基 类 来 保存 共享 设施 。 
2. 企 每 个 测试 方法 中 ， 利 用 单独 一 个 类 中 的 工具 方法 来 建立 夹具 对 象 。 


尽管 这 种 重 构 看 起 来 是 个 大 工程 ， 但 我 向 你 保证 ， 丈 算 你 是 第 一 次 把 缺乏 内 聚 的 复杂 夹具 搞 帮 ， 且 不 小 心 破坏 了 某 些 功能 ， 
也 只 需 付出 很 少 的 代价 。 对 我 来 说 是 如 此 。 
谨 愤 的 测试 数据 
这 并 不 是 说 你 每 次 都 要 在 每 个 测试 中 使 用 完全 相同 的 数据 集 。 我 的 朋友 ].B. 指 出 ， 谨 慎 地 在 每 个 测试 中 使 用 不 同 的 测试 数 
据 ， 可 以 降低 复 用 雷同 夹具 对 象 的 可 能 性 。 
同样 ， 如 果 字 符 串 的 精确 值 对 于 测试 没有 意义 ， 那 么 使 用 “无 所 谓 文字 替代 引用 叫做 productDesctiption 的 夹具 对 象 会 是 个 


好 主意 。 可 读 性 胜 过 可 维护 性 ; 比 起 完美 内 聚 和 绝对 无 重复 ， 传 达意 图 通常 更 加 重要 ， 所 以 ， 说 慎 地 使 用 你 的 测试 数据 ! 


[1 如果 你 容易 焦虑 ， 那 就 永远 也 别 去 看 那些 管理 你 的 养老 金 计 划 、 保 险 或 银行 账户 的 实际 代码 。 相 信 我 ， 这 是 为 你 好 。 


5.10” 忆 结 


本 章 中 我 们 探讨 了 一 些 会 使 维护 工作 更 困难 的 测试 坏 味道 。 尽 管 大 多 数 代码 坏 味道 源 于 不 同 的 可 读 性 问题 ， 但 某 绎 坏 味道 还 
是 由 其 他 缺陷 造成 的 ， 妨 碍 了 维护 和 编辑 测试 的 生产 力 。 


我 们 确信 重复 是 万 逐 之 源 ， 并 指出 测试 之 间 的 每 一 点 重复 都 使 之 更 难以 更 新 和 维护 。 我 们 友 现 测试 代码 中 的 条 件 逻 辑 导致 日 
头 友 和 早衰 ， 因 为 我 们 无 法 知道 测试 的 实际 工作 。 


尤其 令 人 不 安 的 测试 坏 味道 包括 脆弱 的 测试 ， 它 会 随机 失败 ， 而 文件 路 径 削 弱 了 测试 代码 的 移植 性 ， 会 在 他 人 计算 机 上 和 失 
败 。 关 于 文件 路 径 ， 我 们 还 提 到 永久 的 临时 文件 ， 它 在 测试 执行 完毕 后 继续 游荡 ， 后 来 人 以 为 它 不 存储 ,结果 饱 受 折磨。 


沉睡 的 蜗牛 的 坏 味道 与 多 线程 代码 有 关 ， 我 们 拼命 地 争论 对 Thread#sleep 的 调用 ， 由 于 要 等 待 几 百 毫秒 ， 我 们 的 极速 测试 
几乎 都 停 浏 了。 


像素 完美 把 我 们 市 到 图 形 的 世界 ， 过 度 精 确 的 断言 一 一 计算 机 图 形 学 中 滋生 了 肥 时 泡 一 样 易 于 打破 的 超 上 断言， 它 由 魔法 数 
字 和 基本 断言 组 成 。 


对 参数 化 困境 的 分 析 ， 教 给 我 们 对 JUnit 中 的 Parameterized test runner 要 格外 小 心 ， 同 时 也 学 到 一 些 窍门 ， 从 而 当 革 个 匿 
名 测试 突然 失效 或 当 我 们 需要 修改 测试 用 例 时 也 能 平稳 驾驶 。 


最 后 ,我们 冒险 进入 度量 的 领地 ， 来 反思 内 聚 对 测试 类 的 意义 一 一 并 且 ， 当 缺乏 内 聚 时 该 做 什么 ? 


还 没 襄 完 。 下 一 章 我 们 将 深入 另 一 类 测试 坏 味 道 ; 测试 齐 负 了 我 们 对 它 的 信任 。 


第 6 章 可 信赖 


本 章 内 容 包括 : 

` 国 绕 代码 注释 的 测试 坏 味 道 

- 围绕 期 望 管理 不 当 的 测试 坏 味道 
` 围绕 条 件 执 行 的 测试 坏 味道 


信任 是 美好 的 ,我们 喜欢 值得 信赖 的 人 。 我 们 宁愿 能 够 信任 别人 ， 这 样 生活 中 很 多 事情 都 变 得 容易 。 我 们 也 宁愿 能 够 信任 我 
们 的 代码 一 一 这 是 我 们 写 测试 的 原因 之 一 一 一 而 且 代 码 的 可 信和 度 对 我 们 很 重要 。 软 件 开 友 其 实 束 是 在 修改 、 演 进 和 维护 代码 ， 
如 果 我 们 不 能 信任 测试 ， 那 么 在 即使 看 似 最 无 率 的 改动 之 后 ， 我 们 仍然 不 能 确信 代码 能 够 工作 。 


本 草 提 人 到 一 些 对 测试 可 信赖 度 最 严重 的 毁谤 ， 围 绕 着 测试 不 可 靠 的 问题 来 检阅 测试 坏 味道 。 检 阅 先 从 各 种 使 代码 注释 变 坏 的 
方式 开始 。 尽 管用 简单 英文 写 注释 来 标注 代码 可 以 是 一 种 福音 ， 但 这 些 注释 很 容易 由 有 用 的 信息 变 成 误导 。 有 时 甚 全 更 糟 ， 当 整 
个 测试 的 内 容 被 注释 挥 时 ， 测 试 仍然 执行 并 显示 为 成 功 一 一 但 实际 上 它 什么 也 没 做 。 

本 章 接 下 来 围绕 着 各 种 无 法 史 现 (或 错误 暗示) 的 诺言 ， 它 们 将 深信 不 疑 的 程序 员 融 入 卜 途 。 我 们 看 一 看 永 不 失败 (即使 它 
应 当 失 败 ) 的 测试 ， 还 有 说 一 套 做 一 套 的 测试 。 同 时 我 们 会 束 测 试 中 的 条 件 语 句 来 探讨 信任 问题 。 





这 是 一 次 辟 大 检 交 ， 咀 们 开始 吧 。 我 担 不 及 每 地 想 要 哆 哮 我 最 爱 的 话题 一 一 测试 代码 中 的 注释 ! 


6.1 ”注释 挥 的 测试 


程序 员 应 该 向 源 代码 中 点 缀 些 不 可 执行 的 注释 ， 我 不 知道 最 初 这 是 谁 的 主 晶 。 (如 果 你 知道 请 告诉 我 。) 我 们 很 高 兴 我 们 有 
这 种 能 力 ， 因 为 在 试图 理解 代码 时 注释 可 以 帮 上 大 忙 。 

但 是 ， 注 释 党 剃 适得其反， 迷惑 甚至 误导 我 们 。 关 于 测试 ， 一 个 特别 有 趣 的 注释 失效 模式 是 测试 方法 被 注释 挥 了 ， 它 没有 传 
达 任 何 信息 ， 而 只 是 在 迷惑 人 们 。 当 我 们 那样 做 时 ， 我 们 并 没有 注释 任何 事物 一 一 我 们 把 注释 当做 可 怜 虫 的 版 本 控制 。 


我 们 来 看 看 。 
6.1.1 示例 


不 久 前 ,我 刨 出 十 年 前 为 某 个 项 目 写 的 代码 。 我 看 了 代码 好 一 会 儿 ， 更 不 说 开 友 了 ， 我 只 是 在 扫 摘 代码 基 ， 反 复 回想 架构 长 
什么 样 儿 ， 等 等 。 和 平常 一 样 ， 我 通过 查看 测试 来 熟悉 各 种 对 销 。 毕 竟 ， 测 试 是 天 于 代码 行为 最 好 的 文档 。 


当 我 翻阅 某 个 1/O 操 作 类 的 测试 时 ， 我 友 现 测试 类 中 的 15 个 测试 之 一 被 注释 挥 了 。 除 了 这 个 测试 ， 整 个 源 文件 中 没有 其 他 注 
释 了 ， 如 代码 清单 6.1 所 示 。 


代码 清单 6.1 ”为 什么 要 注释 挥 这 个 测试 ? 


// QTest 

// public void recognizesFileBeingModifiedWhenItIs() throws 
// Exception { 

// File newFile = File.createTempFile(getName(), ".tmp"); 
// FileAppendingThread thread = new FileAppendingThread (newFile).,， 
:i thread .startl(ly)s 

// thread.waitUntilAppendingStarts ( ) ; 

KE 二 六 

// Thread.sleep(200); 

// assertTrue(IO.fileIsBeingModified (newFile)); 

er nal 

/:/ thread .interruBt(); 

x 

Ff 


发 现 测试 被 注释 掉 时 ， 我 感到 困惑 。 我 咬 着 嘴唇 扫 视 一 遍 ， 抱 怨 着 世上 的 IDE 把 格式 都 搞 乱 了 。 (1DE 通 常 对 于 注释 一 视 同 
仁 ， 将 它们 格式 化 为 普通 文本 ， 而 不 是 缩 进 的 代码 。) 结果 ， 我 仍然 想 不 起 来 为 什么 会 注释 掉 这 个 测试 。 

将 测试 的 @Test 注 解 注释 掉 时 ， 也 会 产生 同样 的 问题 。 代 码 编译 通过 ， 并 且 看 起 来 像 个 测试 ， 但 是 JUnit 不 会 将 其 当成 测试 
来 运行 ， 因 为 注解 不 见 了 。 口 ] 

假设 我 注意 到 缺失 的 注解 (并 不 见得 很 容易 注意 到 ) ， 那 么 为 什么 会 缺失 ? 天灾? 人 祸 ? 还 是 有 人 故意 临时 地 禁 掉 测 试 ， 事 
后 忘记 恢复 就 提交 了 ? 谁 知道 呢 。 


6.1.2 ”该 对 它 做 扣 儿 什么 


当 你 友 现 测试 (或 其 一 部 分 ) 被 注释 挥 了 ， 你 其 实 看 到 的 是 死 代码 。 或 许 它 曾经 具有 意义 和 目的 ， 但 如 今 要 么 不 存在 了 ， 要 
么 到 失 了 ， 你 无 法 想 铺 注释 挥 的 代码 为 什么 会 在 那儿 。 


好 消息 是 你 所 要 做 的 已 经 很 清楚 了 。 首 先 ， 你 问 问 周围 有 谁 了 解 这 个 测试 。 上 如 果 没 和 人 记得， 事情 就 变 得 简单 而 粗暴 了 : 


1. 妾 试 理解 并 验证 它 的 目的 。 如 果 你 找到 了 ， 取 消 注释 并 重 构 测试 ， 这 样 它 能 更 好 地 沟通 意图 。 


2. 否 则 ， 删 把 它 。 


对 了 。 删 掉 它 。 注 释 掉 的 代码 无 权 待 在 你 的 代码 基 中 ， 一 分 钟 都 不 行 。 永 不 执行 的 测试 代码 仅仅 是 噪声 ， 它 无 法 给 你 更 多 关 
于 实现 的 正确 性 的 信息 ， 也 不 能 指导 设计 。 那 就 像 试图 听 懂 一 个 疯子 糟 料 的 独 日 。 你 先 检查 是 否 今 后 在 需要 时 能 够 从 版 本 控制 中 
找 回 那 段 代码 ， 这 我 不 怪 你 一 一 但 它 现 在 就 该 走 ! 





在 代码 清单 6.1 的 情况 下 ， 我 最 终 设法 找 出 了 测试 的 目的 。 我 不 得 不 取消 注释 ， 运 行 测试 看 它 是 否 通 过 。 当 我 运行 测试 时 ， 
它 通过 了 。 我 仍然 不 明白 它 为 什么 被 注释 掉 。 然 后 我 党 试 在 Windows 电 脑 而 非 Mac 上 运行 ， 测 试 失败 了 ! 这 表明 不 同 的 平台 以 
稍微 不 同 的 方式 来 处 理 时 间 。 


好 一 会 儿 我 才 最 终 确定 ,我 大 概 曾 经 工作 在 这 个 测试 上 ， 由 于 切换 到 其 他 的 任务 ， 于 是 就 任 其 注释 掉 并 提交 到 版 本 控制 中 ， 
然后 态 得 一 干 二 净 。 


这 种 测试 其 实 曾经 具备 目的 。 有 时 ， 目 的 消失 了 很 久 ， 或 深 藏 在 不 太 具 表达 力 的 测试 代码 育 后 ， 我 们 最 好 删除 它 然 后 前 进 。 


6.1.3 小结 


注释 掉 的 代码 永远 不 会 运行 。 那 是 死 代码 。 这 种 代码 在 当初 写 的 时 候 曾 经 具备 目的 ， 但 注释 挥 的 代码 的 价值 快速 腐 坏 
特别 是 如 果 你 有 版 本 控制 (你 应 该 有 ) 时 。 当 你 用 脑袋 撞墙 ， 试 图 理解 和 回想 为 什么 测试 被 注释 掉 和 它 是 否 应 该 存在 时 ， 那 价值 
迅速 对 生产 力 产生 冲击 。 





这 些 情况 下 ， 你 需要 务实 。 如 果 你 不 能 迅速 找 出 注释 掉 的 测试 的 目的 ， 很 可 能 你 永远 也 不 能 。 如 果 看 上 去 是 这 种 情况 ， 你 最 
好 删 掉 测试 。 如 果 我 们 设法 解读 出 它 存 在 的 理由 ， 你 应 该 确保 意图 从 现在 开始 表达 得 更 好 。 


忌 之 ， 注 释 挥 的 测试 散 友 着 坏 味道 ， 因 为 它们 困扰 着 那些 想 要 弄 浓 注释 原因 的 程序 员 。 我 们 下 一 个 测试 坏 味道 仍然 涉及 注释 
和 缺失 的 “为 什么 ”， 但 来 和 目 一 个 完全 不 同 的 角度 。 


[1 如 果 测 试 的 注解 和 方法 签名 保持 不 变 ， 只 是 测试 内 容 被 注释 挤 了 呢 ? 即使 你 什么 都 没 检 查 ， 你 的 工具 会 运行 并 报告 说 通过 。 
我 们 会 在 6.4 节 回 到 这 个 问题 。 


[2] 你 可 以 查询 版 本 控制 系统 。 我 不 大 会 介意 。 


6.2 ”版 义 注 释 


尽管 注释 挥 的 代码 往往 无 用 而 且 特 别 令 人 困惑 ， 即 使 是 真实 的 注释 一 一 用 来 沟通 代码 的 目的 一 一 也 能 友 出 坏 味道 。 一 种 特 
别 恶 心 的 坏 味道 融 是 收 义 注 释 。 


歧义 注释 胡说 八道 ， 说 的 不 一 定 是 真 的 。l1 有 时 可 怜 的 程序 员 阅 读 上 岐 义 注释 并 信以为真 ， 结 果 走 入 歧途 。 
我 们 看 一 个 测试 ， 岐 义 注释 在 那里 玩弄 着 毫 无 戒心 的 程序 员 。 
6.2.1 示例 


代码 清单 6.2 的 例子 来 自 讨 债 机 构 的 会 计 系 统 。 它 测试 一 个 账 尸 (Account) 的 信誉 是 否 民 好， 取决 于 它 是 否 还 有 过 期 的 未 
偿 债 务 。 花 几 秒 阅读 代码 清单 ， 理 解 测试 在 做 什么 。 


代码 清单 6.2” 收 义 注释 欺骗 室 无 戒心 的 程序 员 


GTest 
public void pastDueDateDebtFlagsAccountNotInGoodStanding() { 
// create a basic account 


Customer customer = new Customer().; 
DeliquencyPlan deliquencyPlan = DeliquencyPlan .MONTHLY.; 
Account account = new CorporateAccount (customer, deliquencyPlan).; 


// register a debt that has a due date in the future 
Money amount = new Money ("EUR", 1000).， 
account .add (new Liability(customer, amount, Time.fromNow(1, DAYS))).,; 


// account should still be in good standing 
assertTrue(account.inGoodStanding()); 


// fast-forward past the due date 
Time.moveForward(1, DAYS).， 


// account shouldn't be in good standing anymore 
assertFalse(account.inGoodStanding()).， 


那么 ， 测 试 在 做 什么 ”很 明显 包含 了 几 个 步 又， 正如 那些 仅 存 的 单行 注释 和 用 来 分 割 代码 块 的 空 行 所 示 。 第 一 段 我 们 创建 一 
个 基本 账户 ， 然 后 向 账户 注册 一 笔 债务 ， 然 后 验证 账户 的 信誉 随 着 时 间 超 过 截止 日 期 而 由 好 变 差 。 


简单 吗 ” 是 的。 除了 两 个 注释 是 误导 的 ， 很 可 能 对 于 测试 的 实际 行为 给 出 了 错误 的 印象 。 


特 先 ， 第 一 段 代 码 据说 创建 了 一 个 “基本 ”账户 ， 但 代码 实际 上 却 用 特定 的 拖 闪 计划 创建 了 一 个 企业 账户 
(CorporateAccount) 。 那 不 是 我 所 认为 的 “基本 ”。 其 次 ， 尽 管 我 们 实际 上 将 时 间 快 进 到 截止 日 期 当天 ， 后 一 个 注释 却 识 我 
们 将 时 间 模 拟 为 “超过 截止 日 期 " ， 处 于 当天 与 超过 截止 日 期 是 不 同 的 。 你 注意 到 那个 细节 了 吗 ? 


注释 所 摘 述 的 行为 与 代码 实际 行为 之 间 仓 人 在 差异 ， 这 类 差异 具有 误导 性 。 有 时 那些 差异 还 无 所 谓 ; 有 时 却 因为 我 们 忽视 了 关 
异 ， 最 终 化 了 额外 的 15 分 钟 来 调试 ， 并 错误 地 理解 了 代码 行为 。 


那么 我 们 如 何 来 治疗 这 个 毛病 ? 


6.2.2 ”该 对 它 做 点 儿 什 么 


对 于 注释 挥 的 测试 ，6.1.1 节 中 建议 应 该 要 么 取消 注释 并 重 构 到 更 好 的 写法 ， 要 么 删除 。 删 除 挥 注释 总 是 值得 去 考虑 ， 这 里 
目 收 义 注释 。 那 类 注释 浆 大 于 利 ， 应 该 消灭 。 但 它 很 可 能 曾 是 有 章 为 乙 ， 问 题 是 用 什么 来 蔡 换 它 呢 ? 


如 果 误 导 的 测试 看 起 来 正在 解释 代码 的 行为 ， 那 种 坏 味道 其 实在 召唤 更 可 读 的 测试 。 我 通常 推荐 以 下 两 个 解决 方案 之 一 : 
1. 将 注释 蔡 换 为 更 好 的 变量 和 万 法 名 。 


2. 从 被 注释 的 代码 段 中 抽取 一 个 方法 ， 并 妥善 命名 。[ 








这 种 注释 一 一 拍 述 代码 行 问题 在 于 ， 代 码 实际 上 应 当 负 责 沟通 自己 的 意图 。 如 果 你 感觉 你 需要 一 个 注释 来 解 
释 代 码 行为 ， 你 仍 有 重 构 的 余地 。 或 许 你 没有 妥善 地 对 变量 命名 。 或 许 代 码 段 应 当 封 半 在 一 个 具有 摘 述 性 名 字 的 私有 方法 内 。 


怎样 写 好 注释 ? 


简 言 之 ， 好 的 代码 注释 解释 为 什么 ， 而 非 做 什么 


每 当 你 碰 到 一 个 解释 代码 行为 的 注释 ， 那 就 是 代码 坏 味道 。 代 码 应 当 足 够 可 读 ， 从 而 没有 注释 的 必要 。 有 一 些 情况 下 ， 真 的 
需要 注释 。 在 那 种 情况 下 ， 注 释 解 释 着 某 个 代码 块 的 缘由 。 

例如 ， 一 个 注释 在 解释 复杂 for 循 环 的 行为 ， 它 就 意味 着 坏 味 道 ， 而 另 一 个 类 似 的 fot 循 环 却 可 能 具有 良好 有 效 的 注释 ， 它 在 
解释 循环 有 多 了 丑陋， 因为 那 是 一 段 性 能 上 至 关 重 要 的 代码 ， 你 还 没有 找到 一 个 在 不 牺牲 性 能 的 前 提 下 改进 可 读 性 的 方式 。 

每 当 你 发 现 自己 在 写 注 释 ， 问 问 自己 到 底 在 描述 “做 什么 ”还 是 “为 什么 ”。 然 后 重新 考虑 你 是 否 该 写 注释 ， 还 是 重 构 被 注 
释 的 代码 。 

有 时 程序 员 在 方法 中 添加 注释 ， 以 看 得 见 的 方式 使 得 代码 段 互 相 分 离 。 这 个 考虑 可 以 有 ， 因 为 最 终 目的 还 是 使 代码 更 加 容易 
阅读 。 但 这 种 方式 值得 两 椎 。 

这 种 情况 下 ， 我 通常 建议 用 空 行 来 替换 注释 一 一 人 至少 空 行 不 会 像 注 释 那 样 有 时 会 腐 坏 。 我 的 一 个 同事 习惯 于 从 方法 中 删除 
所 有 空 行 ， 因 为 那些 是 代码 坏 味道 。 如 果 你 需要 用 空白 字符 来 区 分 步骤 ， 就 表明 那个 方法 太 大 了 。 尽 管 那 听 起 来 有 点 极端 ， 但 他 
是 有 道理 的 。 那 个 方法 可 能 太 大 了 ， 你 真 的 应 该 考虑 重 构 ， 可 能 会 是 抽取 一 全 两 个 方法 。 





6.2.3 小结 
存在 各 种 好 注释 和 各 种 烂 注释 。 后 者 明显 多 于 前 者 。 所 以 ， 当 在 测试 代码 中 中 到 (或 编写 ) 那些 看 似 有 用 的 注释 时 ， 崇 尚 测 
试 的 程序 员 应 该 持 谨慎 态度 。 


我 们 仅仅 探讨 了 一 种 特别 讨厌 的 注释 : 紧 义 注 释 。 攻 义 注 释 的 主要 问题 是 不 够 可 靠 并 且 无 法 信任 。 当 我 们 扫 视 源 代 码 ， 我 们 
往往 还 是 会 阅读 那些 注释 ， 并 且 乐 观 地 相信 注释 内 容 ， 而 不 去 对 照 实际 代码 来 核实 假设 。 


我 们 并 非 故 意 地 误导 自己 和 同事 。 通 常 注释 最 初 都 是 有 效 和 正确 的 ， 但 随 着 代码 变更 和 时 间 推 移 注释 会 慢 慢 腐 坏 ， 失 去 同 


步 ， 变 得 武断 和 令 人 困惑 。 它 融 变 成 了 收 义 注释 。 
我 们 探讨 了 处 理 误导 的 测试 的 常见 方案 。 结 果 都 归结 为 去 掉 它 。 当 我 们 删除 注释 ,我 们 也 重 构 代码 ， 这 样 它 不 用 注释 也 可 
读 。 我 们 可 以 通过 更 好 的 变量 进行 命名 ， 或 抽取 代码 段 到 私有 方法 中 ， 两 种 都 需要 给 予 描述 性 的 名 字 。 


好 的 注释 会 解释 代码 现状 的 缘由 。 那 是 我 们 无 法 通过 编程 语言 的 构造 表达 出 来 的 。 其 他 的 殊 大 胆 地 删 挥 ， 并 通过 重 构 来 替换 
吧 。 


最 后 ， 比 起 不 可 运行 的 注释 ， 可 运行 的 测试 代码 能 告诉 我 们 更 多 。 我 们 的 下 一 个 测试 坏 味道 仍然 缺乏 信息 价值 。 一 个 可 运行 
的 测试 却 不 会 失败 ， 你 认为 它 如 何 友 挥 作用 ? 


[1] 所 有 的 注释 都 像 那 样 ; 它们 不 随 所 注释 的 代码 一 起 执行 ， 所 以 它们 很 容易 变 得 陈旧 。 
D2] 令 人 惊奇 的 是 ， 新 的 方法 名 与 被 替换 的 注释 几 平 一 样 。 
6.3” 永 不 失败 的 测试 


永 不 失败 的 测试 就 像 罗 礼 士 | | 一样 一 一 百 战 百胜 一 一 那 不 是 件 好 事 儿 。 不 能 失败 的 测试 不 具有 价值 ， 出 了 事情 它 决 不 警告 
你 。 永 不 失败 的 测试 比 没有 测试 还 糟 ， 因 为 它 给 你 虚假 的 安全 感 。 


6.3.1 示例 


检查 是 否 抛 出 期 望 的 异常 ， 或 许 这 是 最 常见 的 存在 永 不 失败 的 测试 的 上 下 文 。 四 这 有 个 例子 ， 见 代码 清单 6.3。 
代码 清单 6.3” 永 不 失败 的 测试 
QTest 


public void includeForMissingResourceFails() { 
try 【{ 


new Environment() .include("somethingthatdoesnotexist").; 
} catch (IOException e) { 


assertThat (e.getMessage(), 


contains ("somethingthatdoesnotexist")).; 


这 个 代码 清单 中 测试 的 结果 是 这 样 的 : 

1. 如 果 代码 如 期 工作 并 抛 出 异 弟 ， 那 个 异常 束 被 catch 代 码 块 捕获 ， 于 是 测试 通过 。 

2. 如 果 代码 没有 如 期 工作 ， 也 丈 是 没有 抛 出 异常 ， 则 方法 返回 ,测试 通过 ,我 们 并 未 意识 到 代码 有 任何 问题 。 
6.3.2 该 对 它 做 点 儿 什 么 


每 当 你 测试 抛 出 异 剃 时 ， 若 没有 抛 出 异 党 确保 不 要 筷 记 调用 fail()。 代 码 清单 6. 和 出 了 正确 的 解决 方案 。 


代码 清单 6.4” 补 元 调用 缺失 的 fail0 来 使 测试 起 作用 


GTest 
public void includeForMissingResourceFails() { 除非 抛 出 异 
try ( 常 ， 否 则 测 
new Environment() .include("somethingthatdoesnotexist").; 试 失败 
流放 和 计 训 


} catch (IOException e) 1{ 
assertThat (e.getMessage(), 


contains ("somethingthatdoesnotexist")); 


简单 地 增加 对 JUnit 中 fail0 方 法 的 调用 @， 使 得 测试 起 作用 。 现 在 除非 抛 出 期 望 的 异常 ， 否 则 测试 失败 。 


JUnit 4 引入 的 一 个 新 特性 是 @Test 注 解 的 expected 属 性 。 这 个 属性 向 JUnit 声 明 你 期 望 测试 方法 会 抛 出 指定 类 型 的 异 剃 ， 否 


日 中 人 关 二 吴 
则 测试 应 当 失 败 。 基 本 上 ， 我 们 去 挨 了 整个 try-catch 代 码 块 和 容易 遗漏 的 fail0 调 用 。 代 和 码 清单 6.5 基 于 注解 的 方式 ， 重 写 了 代码 
清单 6.4 中 的 例子 。 


代码 清单 6.5 ”用 @Test 注 解 来 声明 和 期 待 异 常 


GTest (expected = IOException.class,) 
public void includingMissingResourceFails() { 


new Environment() .include("somethingthatdoesnotexist"),， 


} 


更 短 、 更 容易 解析 、 更 不 易 出 错 和 遗漏 。 这 种 方式 的 缺点 也 很 明显 : 我 们 不 能 访问 所 抛 出 的 实际 异常 对 象 ， 无 法 进一步 对 异 
党 进行 断言 。 例 如 ， 代 码 清单 6.4 中 我 们 检查 了 异常 消息 ， 其 中 包含 了 造成 异常 的 缺失 资源 名 称 。 


除了 宣 进 “不 要 犯错 ”， 防 止 偶然 地 写 一 个 永 不 失败 的 测试 ， 最 好 的 万 法 残 是 乔 成 运行 测试 的 习惯 ， 或 许 是 临时 修改 被 测 代 
码 来 故意 触 友 一 次 失败 ， 从 而 看 到 它 失败 。 


6.3.3 人 小结 


测试 该 失败 时 就 应 当 失 败 。 这 是 不 言 而 喻 的 ， 但 对 于 给 我 们 虚假 安全 感 的 永 不 失败 的 测试 而 言 ， 这 很 重要 。 当 诊断 问题 时 ， 
我 们 不 希望 被 测试 融入 版 途 。 


永 不 失败 的 测试 多 见于 检查 抛 出 异常 的 测试 中 ， 因 为 很 容易 将 try-catch 代 码 块 搞 砸 。 当 没有 没有 抛 出 异常 时 ， 我 们 可 能 会 
态 记 调用 fail()， 或 者 不 小 心地 否 掉 了 应 当 抛 给 JUnit 的 异常 。 


如 果 你 仅仅 天 心 抛 出 异常 或 异常 属于 特定 类 型 ，@Test 注 解 的 expected 属 性 是 你 的 朋友 。 如 果 你 想 更 加 详细 地 检查 擅 出 的 
异 党 ， 你 没有 其 他 选择 ， 只 能 将 你 的 代码 豪 入 try-catch 代 码 块 ， 并 仔细 地 做 对 。 


[1] 查 克 * 诺 里 斯 是 空手 道 世界 冠军 、 美 国电 影 演 员 。 他 有 另 一 个 更 为 人 所 共 知 的 译名 “ 罗 礼 士 ” ， 出 自 功夫 名 片 《 猛 龙 过 
江 》。 他 发 展 电 影 事 业 初 期 ， 在 李小龙 执导 的 武打 电影 《 猛 龙 过 江 》 中 饰演 一 名 空手 道 高 手 Colt， 与 李小龙 在 罗马 斗 兽 场 决斗 ， 
这 是 公认 的 经 典 武打 场面 。 近 年 还 参 演 了 电影 《了 敢死队 2》 。 


D] 另 一 种 第 见 的 永 不 失败 的 测试 就 是 没有 断言 。 





译 者 注 


6.4 ”轻率 承 话 


我 的 住地 最 近 进 行 了 选举 。 为 了 在 投票 中 领先 ， 政 客 们 在 几乎 所 有 电视 频道 中 辩论 和 接受 采访 。 你 或 许 听 够 了 政治 笑话 ， 领 
悟 了 政客 往往 会 做 出 不 会 兄 现 的 承诺 一 一 忠 有 好 借口 ， 但 依然 太 过 轻率 。 





程序 员 也 会 像 那 样 。 当 你 浏 虹 测 试 代码 时 ， 你 经 常 像 师 蛛 侠 一 样 感到 难受 ， 因 为 你 看 到 一 个 过 度 承 诺 的 测试 。 这 明显 是 程序 
员 锌 不 可 信赖 的 测试 误导 而 造成 的 问题 。 


有 很 多 方式 来 友 酵 这 个 测试 坏 味道 ， 那 么 我 们 融 看 一 些 例子 。 


6.4.1 示例 


对 易 承 诺 的 潜在 主题 是 测试 做 的 比 说 的 少 一 一 或 根本 没 做 。 通 党 有 三 类 表现 : 





: 测试 无 所 事 事 。 
` 测试 实际 上 没有 测试 任何 东西 。 
` 测试 名 不 符 实 。 
第 一 个 可 以 识 是 最 公然 地 享 负 了 程序 员 的 信任 ， 见 代码 清单 6.6。 


代码 清单 6.6 无所事事 的 测试 几乎 没有 用 处 


GTest 
public void filteringObjects() throws Exception { 


//Array array = new Array ("Joe", "Jane", "john").; 

//Array filtered = array.filter (new Predicate<String>() { 
// public boolean evaluate(String candidate) { 

// return candidate.length() == 4; 

// } 

hs 

//assertEquals (new Array ("jane", "john"), filtered).， 


我 们 在 这 个 代码 清单 中 见 到 所 有 的 测试 内 容 都 注释 挥 了 。 基 本 上 ， 这 个 测试 方法 是 空 操作 ， 应 当 忽 略 挥 。 实 际 上 ， 我 们 的 测 
试 框架 会 运行 这 个 测试 并 报告 成 功 ， 潜 在 地 误导 着 程序 员 ， 他 在 IDE 中 看 到 测试 标注 为 通过 ， 还 以 为 测试 名 称 所 摘 述 的 功能 
个 任 了 。 换 句 话 说， 这 像 是 注释 挥 的 测 试 ， 但 是 更 糟 ! 





O 


一 步 ， 当 我 们 扫 视 这 个 注释 挥 的 测 坛 ， 我 们 无 法 忽视 已 。 代 码 写 出 来 然后 注释 挥 ， 这 忠 有 理由 此 
个 测试 应 该 通过 吗 ? 是 否 某 人 在 做 实验 之 后 志 记 了 去 掉 注 释 ? 我 们 不 知道 。 


尽管 不 常见 到 整个 注释 掉 的 或 者 无 所 事 事 的 测试 我们 第 二 轻易 承诺 的 原型 例子 更 为 常见 。 代 码 清单 6.7 展 示 了 这 种 测试 的 
通常 表现 。 


代码 清单 6.7 没有 任何 检查 的 测试 几乎 没有 用 处 


GTest 

public void cloneRetainsEssentialDetails() throws Exception 1{ 
Document model = ModelFactory.createDocument ( ) ; 
model.schedule(new Transaction("Test", date("2010-01-20"), 1)); 
model = model.clone().; 
Transaction tx = model .getScheduledTransactions() .get (0); 


乍 看 没什么 问题 。 它 短小 、 相 当 平 衡 ， 而 且 具 有 清楚 、 可 理解 的 名 字 一 一 克隆 体 包含 基本 的 细节 (clone retains essential 
details) 。 但 是 仔细 一 看 ， 发 现 这 个 测试 实际 根本 没有 检查 克隆 体 是 否 包 全 基本 的 细节 。 没 有 assertTrue、assertEquails、 
assertThat 一 一 没有 任何 断言 。 那 意味 着 无 论 克 隆 体 的 行为 如 何 ， 这 个 测试 都 会 通过 。 具 体 来 说 ， 只 有 当 运 行 代码 时 抛 出 了 异 
常 ， 测 试 才 会 注意 到 克隆 体 没有 按 要 求 工作 。 





有 人 叫 这 种 测试 为 正常 路 径 测试 ， 因 为 它们 往往 不 会 失败 ， 总 是 表示 一 切 正常 。[] 
最 后 ， 我 们 的 第 三 个 例子 描述 如 代码 清单 6.8 所 示 。 它 或 许 代表 了 最 常见 的 轻易 承诺 病理 。 


代码 清单 6.8 ”测试 做 的 比 说 的 少 


@Test 

public void zipBetweenTwoArraysProducesAHash() throws Exception { 
Array keys = new Array ("a", "b", "c"); 
Array values = new Array(l1, 2, 3); 


Array zlipped = keys.zip(values),， 
assertNotNull("We have a hash back", zipped.flatten()).; 


通读 这 个 代码 清单 ， 你 看 到 轻易 的 承诺 了 吗 ? 测试 的 名 字 表 明 两 个 数组 对 象 之 间 的 Zip (压缩 ) 操作 后 会 产生 一 个 哈 希 值 。 
但 测试 只 检查 了 zip 万 法 然后 返回 了 不 为 空 的 展 平 (flatten) 数组 。 这 与 zip 方 法 返回 哈 硕 值 非 音 不同， 你 竞 得 呢 ? 


这 些 测试 的 例子 ， 都 是 说 一 套 做 一 套 ， 会 让 可 怜 的 程序 员 长 出 白头 友 的 ， 他 还 以 为 所 述 的 行为 存在 并 且 正 常 工 作 ， 然 而 现实 
却 恰恰 相反 。 我 们 谈 谈 如 何 来 避免 这 个 问题 。 


6.4.2 该 对 它 做 点 儿 什 么 


让 我 们 看 看 代码 清单 6.6 中 的 情况 ， 测 试 内 容 被 注释 掉 了 。 


首先 ,我 们 为 什么 要 注释 掉 它 ? 或 许 我 们 开始 编写 ， 然 后 半途 意识 到 步子 轧 得 太 大 了 ， 注 释 掉 它 ， 换 个 测试 的 写法 ， 却 所 记 
回来 充实 注释 挥 的 测试 。 或 许 我 们 尝试 的 一 些 事情 破坏 了 测试 ， 可 能 为 了 想 要 快速 恢复 回去 ， 于 是 决定 注释 掉 而 不 是 删除 它 。 


无 论 什么 原因 ， 都 有 更 好 的 选择 。 头 号 原则 殊 是 删除 代码 ， 而 不是 注释 擅 。 你 有 版 本 控制 ， 对 吧 ? 而 且 ， 现 代 IDE 具 备 本 地 
历史 ,我 们 可 以 撤销 变更 ,不 会 到 达 版 本 控制 仓库 。 


一 个 空 测试 也 比 注释 掉 好 得 多 ， 因 | 为 它 是 清楚 的 测试 占 位 符 一 一 针对 目前 缺失 、 破 碎 或 未 验证 的 行为 。 


在 代码 中 维护 测试 列表 





许多 程序 员 维 护 一 个 测试 列表 一 一 应 当 编 写 的 测试 (但 还 没 写 ) 。 除 了 斋 键 琢 ， 有 些 程序 员 音 欢 纸 上 涂鸦 的 低 科技 方式 。 其 
他 人 愿意 将 测试 列表 保留 在 测试 代码 旁边 。 尽 管 我 个 人 倾向 于 为 测试 类 增加 //TODO 注 释 来 识别 缺失 的 测试 ， 但 其 他 人 愿意 创建 


空 的 测试 方法 占 位 符 。 


使 用 空 占 位 符 方法 作为 测试 列表 会 导致 轻易 的 承诺 ， 当 程序 员 前 后 移动 代码 ， 会 偶然 地 漏 掉 一 些 占 位 符 。 考 虑 到 这 一 点 ， 我 
建议 用 JUnit 的 (@Ignore 注 解 来 标记 占 位 符 ， 更 加 明确 地 指出 那些 测试 还 没有 恰当 地 实现 ， 且 所 描述 的 行为 还 不 存在 。 





更 好 的 是 拿 起 旧 笔 和 纸 。 除 了 清晰 地 分 开 已 实现 与 要 实现 的 ， 纸 笔 不 会 拘泥 于 文字 记录 一 一 你 可 以 画 草图 ， 这 是 描述 你 的 想 


法 的 最 自然 方式 。 


第 二 种 轻易 承诺 的 原型 显示 在 代码 清单 6.7 中 : 没有 断言 的 测试 。 解 决 方案 很 简单 : 确保 你 断言 了 一 些 事情 。 尽 管 你 会 钻研 
你 最 喜欢 的 静态 分 析 工 具 ， 去 找 出 一 种 目 动 检查 的 方式 ， 但 还 有 一 种 简单 的 技术 帮助 放置 断言 : 从 断言 开始 。 


当 你 乞 从 输入 最 终 的 断言 来 开始 写 测 试 ， 你 很 难 会 从 结果 测试 中 偶然 地 移 除 断 言 。 此 外 ， 从 断言 开始 有 助 于 专注 在 测试 的 本 
质 上 。 具 体 哪个 是 我 们 要 在 测试 中 检 覃 的 行为 ? 


从 断言 开始 能 帮助 你 避 开 第 三 个 轻易 承 诡 的 例子 ， 见 代码 清单 6.8 一 一 测试 检查 的 远 没有 名 字 中 表明 的 那样 彻 后 。 毕 竟 ， 当 
你 只 有 测试 名 字 和 断言 语句 ， 几 乎 不 可 能 看 不 到 它们 之 间 的 冲突 。 





一 个 窃 门 是 最 初 将 测试 名 字 留 空 ， 或 者 比如 叫做 TODOO， 直 到 你 完整 地 刻画 出 了 测试 。 一 旦 你 确切 找 出 要 检查 的 行为 ， 


另 
就 很 容易 命名 测试 。 

这 里 的 关键 ， 以 及 所 有 这 些 穹 门 ， 束 是 使 程序 员 (你 ) 尽量 简单 地 看 到 和 注意 到 测试 没有 并 做 到 它 所 声称 的 样子 。 考 虑 到 这 
一 点 ， 仅 仅 保 持 测试 小 而 专注 已 经 是 一 个 巨大 的 帮助 了 。 
6.4.3 ”小 结 

本 节 中 我 们 讨论 了 没有 兄 现 承 诺 的 测试 。 我 们 识别 出 三 种 原型 ; 

: 测试 无 所 事 事 。 


` 测试 实际 上 没有 测试 任何 东西 。 


” 测 试 名 不 符 实 O 


所 有 这 些 情况 下 ， 我 们 都 做 着 错误 的 假设 ， 基 于 这 些 假设 做 出 有 瑕 意 的 决定 ， 看 着 错误 的 地 方 却 友 现 事情 和 设想 不 一 至， 于 
是 我 们 将 上 自己 和 同事 置 于 浪费 时 间 的 风险 中 。 时 间 是 我 们 生命 中 真正 的 约束 之 一 一 一 不要 因为 测试 的 轻易 承诺 而 将 时 间 浪 费 在 
如 此 贰 本 的 错误 中 。 





考虑 到 这 一 点 ， 你 一 定 要 删除 代码 而 非 注释 掉 它 ， 确 保 你 没有 留 下 缺少 断言 的 测试 ， 小 心 曼 曙 地 将 测试 的 名 字 与 其 实际 的 检 
查 保持 一 致 。 从 断言 开始 ， 写 完 测试 再 命名 ， 保 持 测试 短小 ， 这 些 都 非常 有用。 最后， 在 分 秒 必 争 时 ， 如 此 细微 的 纪律 会 节约 许 
多 时 间 。 


襄 到 纪律 ， 我 们 的 下 一 个 测试 坏 味道 闻 起 来 屿 乏 纪 律 。 


[1] 其 中 一 些 测试 是 因为 测试 失败 后 有 人 删除 了 断言 。 我 不 是 开玩笑 。 


6.5 ”降低 期 性 


程序 员 往 往 注重 细节 。 我 们 往往 也 会 偷懒 ,经常 找 最 简单 的 做 事 方式 。 这 没 错 
但 是 有 时 我 们 过 分 了 ， 结 果 搬 起 石头 磺 了 目 己 的 脚 。 


很 多 时 候 我 们 应 该 做 最 简单 的 事情 一 一 





因为 采取 了 简化 方式 ， 这 个 测试 坏 味道 歌 叫 做 降低 期 性， 代价 融 是 降低 了 确定 性 与 精确 度 的 标准 。 这 种 捷径 弟 单 能 帮 你 走 得 
更 快 ， 也 足以 造成 新 增 代 码 与 程序 的 输出 或 行为 有 所 不 同 。 长 期 来 看 ， 这 种 测试 由 于 不 够 精确 ， 会 造成 一 种 虚假 的 安全 感 。 


我 们 看 看 例子 中 编 合 的 风险 。 
6.5.1 示例 


下 面 的 例子 受 困 于 之 前 讲 过 的 分 割 逻 辑 ， 以 及 降低 的 期 性 。 看 看 你 能 人 否认 出 来 。 
代码 清单 6.9 ”计算 源 代码 的 圈 复 杂 度 


upblLe CLass ConnlexlitvCaleculatorTest { 
private ComplexityCalculator complexity; 


GTest 

public void complexityIsZeroForNonExistentrFriles() { 
assertEquals(0.0, complexity.of (new Source ("NoSuchFile.JjJava"))).,; 

} 

@Test 

public void complexityForSourceFile() { 
double samplel = complexity.of (new Source('"test/Samplel .java")).; 
double sample2 = complexity.of (new Source("test/Sample2.java")); 
assertThat (samplel, is(greaterThan(0.0))); 
assertThat (sample2, is(greaterThan(0.0))).; 
assertTrue(samplel != Sample2) ; 

} 


ComplexityCalculatori 计 算 指定 源 文件 的 圈 复 杂 度 ， 对 于 它 的 行为 ， 代 码 清 单 中 的 测试 类 定义 了 期 望 。 吕 | 


首先 ， 它 已 经 很 明显 地 体现 了 分 割 逻辑 。 测 试 在 处 理 魔 法 数字 ， 因 为 数字 等 于 或 大 于 0.0 的 原因 隐藏 在 两 个 源 文 件 中 ， 引 用 
路 径 为 : test/Sample1.java 和 test/Sample2.java。 


我 们 已 经 知道 如 何 对 付 分 割 逻 辑 ， 那 残 不 耗费 笔墨 了 ;我们 现在 最 天 心 降低 的 期 望 。 


看 看 代码 清单 6.9 中 的 complexityForSourceFile()。 注 意 是 如 何 用 三 个 断言 来 验证 复杂 度 计 算得 正确 。 首 先 ， 我 们 验证 两 个 
源 文 件 的 结果 都 大 于 零 ， 然 后 验证 两 个 结果 互 不 相同 。 假 设 这 个 测试 通过 ， 我 们 可 以 断定 在 计算 育 后 一 定 有 一 些 逻 辑 。 


有 趣 的 “三 角 法 ”导致 稍微 模糊 的 正确 性 断言 ， 这 正 表现 出 降低 的 期 性。 基本 上 可 以 讽 ， 只 要 实际 计算 不 为 零 而 且 两 个 源 广 
件 的 结果 不 同 束 可 以 了 。 换 句 话 说， 那个 测试 对 于 变化 来 癌 极其 健壮 ; 以 至 于 测试 本 该 失败 时 也 不 会 失败 。 


6.5.2 ”该 对 它 做 点 儿 什 么 


对 于 降低 的 期 望 ， 明 显 的 解决 方案 项 是 提高 | 门槛， 使 测试 的 期 性 更 具体 。 对 于 代码 清单 6.9 的 情况 ， 你 应 该 明确 两 个 源 文 件 
的 复杂 度 计算 结果 。 人 简单 的 变更 能 将 五 行 变 成 两 行 ， 如 代码 清单 6.10 所 示 。 
代码 清单 6.10 ”通过 进一步 明确 测试 来 简化 它 


@Test 

public void complexityForSourceFile() { 
assertEquals(2, complexity.of (new Source("test/Samplel .java"))); 
assertEaquals(5, complexity.of (new Source("test/Sample2.Java"))).; 


更 具体 ， 也 更 简单 。 代 码 清单 6.10 仍 然 受 困 于 分 割 逻辑 和 魔法 数字 的 问题 ， 但 不 再 降低 期 望 ;: 如果 我 们 不 小 心 破坏 了 计算 复 
杂 度 [的 算法 ， 这 个 测试 很 可 能 失败 。 


值得 一 提 的 是 ， 完 全 精确 并 非 优点 。 例 如 ， 第 ? 章 中 的 像素 完美 测试 坏 味道 指出 了 过 于 具体 的 测试 的 潜在 问题 。 你 应 访 寻 找 
适当 的 平衡 和 抽象 级 别 来 表达 你 的 测试 。 


6.5.3 “人 小结 





如 果 破 坏 了 指定 行为 ， 测 试 应 当 失 败 。 降 低 期 望 的 测试 坏 味 道 会 导致 过 度 健壮 的 测试 一 一 该 失败 时 却 不 失败 。 


降低 期 望 的 本 质 束 是 断言 太 模 糊 以 至 于 不 能 恰当 地 增 述 期 望 的 行为 。 当 断言 太 模 糊 ， 你 造成 了 虚假 的 安全 感 ; 功能 可 能 会 破 
坏 ， 而 你 的 松散 检查 的 模糊 断言 却 漂 有 党 地 通过 。 


降低 期 望 的 明显 解决 方案 是 提高 |i 槛 ， 使 断言 更 加 具体 和 精确 。 通 过 更 直接 地 表达 你 的 兴趣 ， 使 得 意 图 变 得 明显 ， 避 人 免 虚 假 
安全 感 ， 因 为 当 实 现 出 乎 意料 地 变化 时 ， 测 试 断 言 真 的 会 失败 。 


说 到 这 ， 在 测试 中 省 去 细节 并 非 完全 不 好 。 事 实 上 ， 太 具体 的 断言 意味 着 像素 完美 问题 的 风险 。 


接 下 来 ， 我 们 有 一 些 测试 坏 味道 写 有 条 件 的 行为 有 关 。 第 一 个 是 一 一 正如 生活 中 的 诸 事 一 样 一 一 出 友 点 是 好 的 ， 结 果 却 好 
心 办 坏事 。 


(缺乏 ) 代码 质量 的 合理 指标 。 它 意味 有 涉及 的 方法 极 有 可 能 太 大 了 。 尽 管 一 般 并 不 为 测试 代码 运行 此 类 静态 检 
具有 高 复杂 度 的 测试 方法 表现 出 附加 细节 或 有 条 件 的 测试 。 


[2] 顺便 问 一 句 ， 你 会 对 代码 清单 6.10 中 的 分 割 逻辑 做 些 什 么 ? 


6.6 平台 偏见 


很 久 以 来 ,计算 机 (computer) 这 个 词 指 的 残 是 大 家 使 用 的 某 一 个 具体 产品 。 然 而 ， 程 序 员 您 友 需要 为 他 们 的 软件 考虑 多 
个 平台 和 操作 系统 。 尽 管 Java 曾 经 定 下 了 “编写 一 次 ， 随 处 运行 ”的 调子 ， 但 因为 不 是 所 有 事情 都 能 够 抽象 ， 我 们 还 是 友 帝 目 己 
在 编写 特定 于 平台 的 功能 。 


软件 产品 涉及 多 个 平台 ， 测 试 同样 也 会 。 平 台 仿 见 测 试 坏 味道 可 以 描述 为 无 法 平等 地 应 对 所 有 平台 。 事 实 比 那 更 复杂 ， 但 或 
许 一 个 例子 能 表达 得 透彻 。 
6.6.1 示例 


针对 底层 操作 系统 ， 代 码 清单 6.11 的 例子 检查 Configuration 类 是 否 恰当 地 识别 出 默认 的 下 载 目录 。 
代码 清单 6.11 检查 特定 于 平台 的 下 载 目录 


GTest 
public void knowsTheSystemsDownloadDirectory() throws Exception { 
String dir = Configuration.downloadDir() .getAbsolLutePath () ; 
Platftorm platform = Platform.current()}); 
if (platform.isMac()) {1 
assertEquals (dir, matches("/Users/(.*?)/Downloads")).; 
} else if (platform.isWindows()) { 
assertThat (dir.toLowerCase(), 
matches("cC NNuUuserev Vt. ?Wdownloads™y) ys 


最 引 人 注 目的 是 ， 当 运行 在 不 同 平台 时 ，if-else 将 执行 不 同 的 断言 。 换 句 话说 ， 在 任何 特定 的 平台 上 ， 只 有 一 个 分 支 会 得 到 


有 几 个 理由 说 明 这 是 个 问题 。 首 先 ， 如 果 在 Linux 上 运行 会 怎样 ? 当 运 行 在 非 Mac OS Xx 或 Windows 平 台 时 ， 代 码 清单 6.11 
中 的 测试 束 六 合作 呈 。 其 次 ， 当 运行 测试 时 ， 我们 只 检查 所 在 平台 上 的 正确 行为 。 这 意味 着 无 论 其 他 平台 上 的 行为 是 否 遭 到 破 
坏 ， 测 试 都 将 通过 。 


我 们 能 做 点 儿 什 么 ? 
6.6.2 ”该 对 它 做 点 儿 什 么 


代码 清单 6.11 市 来 几 个 不 同 的 问题 。 首 先 ， 我 们 在 测试 中 隐藏 了 重要 信息 ， 而 它 确实 应 该 对 外 部 可 网 ， 也 就 是 说 ， 单 独 的 检 
查分 支 为 特定 平台 而 执行 ， 但 是 仪 运行 在 那些 特定 的 平台 上 。 


使 那些 分 支 可 见 的 一 种 方式 ， 是 将 代码 清单 6.11 分 割 为 多 个 测试 ， 每 个 平台 一 个 。 如 代码 清单 6.12 所 示 。 


代码 清单 6.12 不 同 平台 的 不 同 测试 


public class TestConfiguration + 
Plattorm plattorm; 
String downloadsDi1r:; 


QBefore 
public void setUp() { 
plattorm = Plattorm.current (}; 
downloadsDir = Configuration.downloadDir() .getAbsolutepPpath(}); 


} 


QTest 
public Vvoid knowsTheSystemsDownloadDirectoryOnMacOsx() 
throws Exception 1 
assumeTrue (platform.1isMac()).; 一 
assertEquals (downloadsDir, 
matches("/Users/(.*?)/Downloads"))}; 
} 


BTest 
public void knowsTheSystemsDownloadDirectoryOoOnWindows () 
throws Exception { 
assumeTrue (platform.isWindows!()).:; 
assertThat (downloadsDir.toLowerCasel(), 
matches("c:\\users\\(.*?) \\downloads")); 





注意 我 们 是 如 何 添加 守卫 语句 的 ， 它 使 用 了 org.junit.Assume#assumeTrue( 假 设 性 API， 当 测试 没有 运行 在 指定 平台 时 ， 
就 中 断 执行 @。 当 该 假设 性 API 失 败 ，JUnit 并 不 会 执行 余下 的 部 分 。 遗 憾 的 是 ，JUnit 会 将 这 些 测试 标记 为 通过 ， 尽 管 我 们 的 确 
不 知道 功能 在 那些 平台 上 是 否 正确 。[ 


即使 特定 于 平台 的 测试 现在 对 外 部 可 见 ， 还 有 第 二 个 和 更 多 的 基本 问题 : 只 有 其 中 的 一 个 测试 会 执行 。 为 了 全 部 运行 三 个 测 
试 ， 需 要 三 个 不 同 的 计算 机 。 这 个 问题 源 于 被 测 代码 的 设计 ， 而 我 们 的 测试 坏 味 道 强调 了 重 构 的 需 


我 们 应 该 尽量 重 构 代码 ， 这 样 能 一 个 测试 接 一 个 测试 来 替换 挥 Platform， 人 允许 我 们 在 任何 平台 上 运行 代码 清单 6.12 中 的 所 
有 测试 。 重 构 之 后 我 们 的 测试 看 起 来 如 代码 清单 6.13 所 示 。 


代码 清单 6.13 ” 重 构 设计 来 去 挥 平台 偏见 


GTest 
public vold knowsTheSystemsDownloadDirectoryOnMacOsx() 
throws Exception { 
String downloadsDir = new MacOsX() .downloadDir(); 
assertEquals (downloadsDir., 
matches("/Users/(.*?) /Downloads")); 


} 


GTest 
public vold knowsTheSystemsDownloadDirectoryOnWindows ( ) 
throws Exception { 
String downloadsDir = new Windows() .downloadDir().; 
assertThat (downloadsDir.toLowerCase(), 
matches("c:\\users\\(.*?) \\downloads")),， 


注意 我 们 直接 实例 化 了 有 具体 的 Platform 子 类 ， 而 非 通过 间接 的 Platform.current(0 ， 然 后 根据 Platform 的 变化 来 运行 条 件 化 
的 测试 ， 以 解决 这 个 问题 。 我 们 需要 在 某 处 测试 Platform.current0 的 平台 检测 行为 ， 但 那些 复杂 行为 不 属于 处 理 平台 实现 的 测 


试 。 
换行 符 和 回 车 符 
如 果 你 工作 的 系统 同时 要 运行 在 Windows 和 UNIX 系 统 上 ， 你 大 概 会 碰 到 这 些 平 台 之 间 值 得 注意 的 地 方 ， 包 括 不 同 的 文件 路 


径 一 -一 以 及 换行 符 。 


传统 上 ，Windows 应 用 程序 要 求 所 有 文本 文件 都 用 两 个 字符 来 分 隔行 ( 回 车 符 CR 和 换行 符 LF 


标准 是 用 一 个 字符 (换行 符 LF 一 一 \n) 。 





\r\n) ， 而 UNIT 类 系统 的 





测试 中 使 用 特定 于 平台 的 换行 字符 而 非 硬 编码 的 \n， 这 件 事 重要 与 否 取决 于 你 所 工作 的 系统 。 通 常 使 用 \n 即 可 ， 我 是 说 通 


谤 
oO 


有 些 程序 员 为 了 更 加 肯定 ， 选 择 使 用 常量 而 不 是 采用 平台 的 约定 ， 比 如 : static final 


StrinegNL=File.pathSeparatorChat==":? ANn :NtNn 

注意 ， 这 样 做 的 话 ， 测 试 代码 仍然 暗示 着 要 处 理 的 数据 文件 要 么 产生 于 测试 代码 中 ， 要 么 满足 特定 于 平台 的 换行 符 。 
6.6.3 ”小 结 

平台 偏见 这 种 测试 坏 味道 ， 往 往 悄悄 地 混 进 支持 多 平台 的 需求 中 ， 比 如 Linux、Mac 和 各 种 Windows 变 种 。 当 你 的 测试 开始 
基于 所 运行 的 平台 而 执行 不 同 的 路 径 和 断言 时 ， 你 可 束 扒 上 大 事 儿 了 ，。 


每 当 你 看 见 测试 中 提 到 多 个 平台 ， 你 应 该 将 它们 拉 出 来 放 入 单独 的 测试 ， 使 它们 对 外 可 见 。 这 样 的 话 ， 至 少 你 能 意识 到 体 在 
者 特定 于 平台 的 逻辑 。 


你 仍然 面 对 着 有 条 件 的 测试 ， 因 为 分 解 测试 并 不 能 解决 实际 问题 。 即 使 分 解 了 测试 ， 并 使 用 JUnit 中 友善 的 Assume API 代 蔡 
粗暴 的 ff-else 手 法 ， 可 能 你 仍然 会 看 看 IDE 中 的 测试 列表 ， 看 着 其 中 命名 民 好 的 测试 摘 述 看 许多 行为 ， 而 错误 地 认为 所 有 行为 在 
所 有 支持 的 平台 上 都 能 工作 ， 因 为 它们 看 起 来 都 通过 了 ， 尽 管 某 些 却 并 未 运行 。 


真正 的 解决 方案 仓 在 于 代码 重 构 中 ， 这 样 才能 消除 测试 坏 味道 。 每 当 你 的 测试 中 存在 平台 偏见 ， 你 应 当 致 力 使 测试 合理 化 ， 
这 样 每 个 测试 都 能 够 实例 化 并 使 用 所 需 的 具体 平台 。 


最 后 ， 平 台 仿 见 的 根源 可 追溯 至 某 处 很 小 一 块 的 平台 检测 逻辑 。 该 逻辑 应 该 用 一 组 测试 隔离 ， 这 些 测试 明 确 地 仅仅 运行 于 一 
个 特定 平台 上 ， 隅 离 问题 并 使 乙 更 加 容易 管理 。 


平台 偏见 是 有 条 件 测试 的 特例 : 执行 (或 不 执行 ) 一 个 深 茂 在 测试 中 的 基于 条 件 的 测试 。 咱 们 人 花 点 功夫 任 更 通用 的 上 下 文中 
来 探讨 这 种 有 条 件 的 测试 。 


[1 这 个 问题 已 经 报 给 JUnit 开发 者 一 段 时 间 了 。 我 对 能 尽快 修复 它 仍然 抱 有 希望 。 


6.7 ”有 条 件 的 测试 


现代 编程 语言 插 有 意思 的 。 多 年 来 我 们 见证 了 语言 进化 和 API 扩 展 。 别 的 不 说 ， 我 们 看 到 了 语言 结构 的 方式 由 库 演变 成 核心 
语言 。 但 是 当 错 误 地 使 用 时 ， 更 强大 却 并 不 见得 好 ， 有 条 件 的 测试 坏 味道 正 是 一 个 位 证 。 


有 条 件 的 测试 是 在 一 个 测试 方法 内 隐藏 了 秘密 条 件 ， 使 测试 逻辑 名 不 符 实 。 前 一 个 平台 偏见 测试 坏 味道 形成 了 一 个 具体 例 


子 ， 但 是 我 们 来 看 一 个 更 加 通用 的 有 条 件 的 测试 的 反面 例子 。 


6.7.1 示例 


代码 清单 6.14 展 示 了 一 个 测试 ， 它 检查 负责 执行 系统 命令 的 Process 对 象 的 行为 。 这 个 特殊 的 测试 会 检查 参数 是 否 正 确 地 传 
入 。 


代码 清单 6.14 ”检查 系统 命令 已 正确 执行 


@Test 促 建 临时 
public void multipleArgumentsAreSentToShell() throws Exception { 文件 
File dir = createTempDirWithChild("hello.txt").; 
Stringl| cmd EE new Strincgl] 1 "Le" "=1"™ diroqetAabsolutepathi(}) 1}’ 
Process process = new Process (cmd) .runAndWait(); 出 
目录 
1f (process. ,exitCodel]) == 0 4 检查 4 列表 
deertEouals( "nelLlc. tt™. Procese. OULOULN() , BPEL) }3 列表 | 
} 


我 们 来 看 看 都 干 了 些 什么 。 首 先 ， 测 试用 一 个 叫做 hello.txt 的 文件 @ 创 建 了 临时 目录 ， 然 后 列 出 临时 目录 的 列表 @。 接 下 
来 ,我们 有 个 隐藏 的 条 件 。["| 如 果 进 程 干 净 地 退出 (退出 码 为 0 ， 我 们 断言 目录 列表 个 精确 地 包含 我 们 期 望 见 到 的 给 定 参 数 。 
条 件 分 支 的 问题 在 于 它 会 等 于 false， 随 后 ， 断 言 并 不 会 执行 而 测试 会 默默 地 通过 。 例 如 ， 我 们 要 是 破坏 了 


Process#runAndWait() 方 法 ， 任 何 系统 命令 都 将 失败 ， 返 回 一 个 非 零 退出 码 。 代 码 清单 6.14 中 的 测试 将 兴高采烈 地 通过 ， 
并 没有 什么 实际 上 和 能够 工作 。 


2 


EL 
六 已 


有 操 儿 出 乎 意料 ,不 是 吗 ? 
6.7.2 ”该 对 它 做 挟 儿 什么 


再 说 一 裔 ， 当 被 测 行 为 遭 到 破坏 时 ， 测 试 束 应 该 失败 。 如 果 有 什么 不 对 劲 儿 ， 你 应 该 大 声 说 出 来 ， 而 不 是 默默 地 承受 。 


铭记 在 心 ， 当 测试 中 误 打 误 撞 产生 了 条 件 分 支 ， 你 应 该 确保 测试 在 每 个 条 件 分 支 时 都 有 机 会 失败 。 代 码 清单 6.14 中 我 们 可 以 
为 进程 成 功 退 出 而 增加 一 个 断言 。[ 人 如 代码 清单 6.15 所 示 。 


代码 清单 6.15 ”用 断言 蔡 换 条 件 


QTest 


public void multipleArgumentsAreSentToShell() throws Exception { 
File dir = createTempDirWithChild("hello.txt"); 


String[l] nd = new Stringl] 1T "Ls", "=1", dir. oetAbsolutepath() }s 
Process process = new Process (cmd) .runAndWait(); 


assertEquals (0, process.exitCode()).; 
ssertEduales ("Mellotxt",. process OuUtput{(}) trim(y); 


增加 了 那个 断言 后 ， 除 非 进 程 正常 退出 ， 否 则 测试 将 失败 ， 这 束 解 决 了 之 前 由 条 件 语 句 造 成 的 问题 。 


除了 确保 每 个 条 件 分 支 都 将 在 适当 的 时 候 触 友 失 败 ， 你 应 该 考虑 将 每 个 分 支 变 成 它 目 己 的 测试 。 毕 葛 ， 如 果 条 件 轧 是 评估 


(evaluate) 为 相同 的 结果 ， 它 融 失 去 了 意义 ， 那 么 显然 软件 应 该 期 竺 多 个 潜在 的 执行 路 径 。 在 代码 清单 6.14 和 代码 清单 6.15 的 
简单 例子 中 ， 备 选 的 执行 路 径 应 是 命令 执行 失败 的 情况 。 因 此 ， 你 可 以 增加 一 个 新 测试 ， 检 查 退 出 码 非 零 : 
QTest 
public void returnsNonZeroExitCodeForFailedCommands() { 
String[] cmd = new String[l] { "this"”, "will", "fail" 上 


Process process = new Process (cmd) .runAndWait(); 
assertThat (process.exitCode(), is(greaterThan(0))).; 


添加 以 后 ， 代 码 清单 6.14 中 的 所 有 条 件 分 支 全 都 用 测试 覆盖 到 了 ， 不 再 受 同样 问题 的 煎熬 。 我 们 最 初 的 测试 确保 参数 传 入 了 
底层 的 命令 行 (shell) ， 并 且 有 测试 看 到 当 系 统 命 令 失败 时 ， 退 出 码 友 出 失败 信号 。 


6.7.3 ”小 结 
测试 中 的 条 件 语句 并 不 好 ， 因 为 它们 往往 会 误导 。 它 们 可 能 会 在 不 应 该 的 时 候 通 过 ， 甚 至 ， 除 非 我 们 启动 调试 器 并 看 到 执行 
路 径 的 确 走 入 了 条 件 分 支 ， 我 们 才能 知道 它们 是 由 于 正确 的 原因 通过 的 。 


作为 首要 原则 ， 测 试 方法 中 的 所 有 分 支 都 应 该 有 机 会 失败 。 再 者 ， 由 于 每 个 分 支 代表 了 一 个 不 同 场景 和 不 同 的 行为 ， 它 们 确 
实 应 该 分 解 到 单独 的 测试 中 去 。 

例如 if 语句 的 条 件 结构 显现 出 某 些 关于 代码 执行 方式 的 不 确定 性 。 如 果 不 是 那样 的 话 ， 且 没有 不 确定 性 ， 那 么 最 好 的 选择 就 
是 删除 条 件 然后 继续 。 上 如 果 存 在 不 确定 性 ， 将 条 件 蔡 换 为 断言 往往 是 个 好 主意 ， 用 于 确认 和 明确 测试 列 含 的 假设 。 
[1 它 隐 藏 在 众 目 联 上 联 之 下 ， 从 类 的 大 纲 和 测试 方法 的 名 字 是 看 不 出 来 的 。 
[2] 在 语义 上 ，JUnit 的 假设 (assumption) 将 更 加 适合 ， 但 是 在 写本 书 时 ，Assume API 仍然 不 正常 ， 失 败 的 假设 会 默默 地 取消 测 
试 并 将 之 标记 为 通过 ， 而 这 不 是 我 们 想 要 的 。 
[3] 没什么 好 理由 在 测试 方法 中 使 用 让 ， 即 使 有 理由 ， 也 总 会 有 更 好 的 选择 。 


6.8 总 结 


本 章 列 出 了 一 些 测试 坏 味 道 ， 处 理 不 可 信和 不 可 靠 的 测试 。 大 约 一 半 的 坏 味道 围绕 着 当 某 些 东 西 被 破坏 了 ， 测 试 也 不 会 告诉 
你 一 一 测试 该 失败 时 却 不 失败 。 另 外 一 半 涉 及 误导 性 的 测试 。 





我 们 从 潜在 的 滥用 注释 开始 ， 形 如 注释 掉 的 测试 和 叔 义 注释 。 你 看 到 永 不 失败 的 测试 的 问题 ， 以 及 做 出 轻易 承诺 的 测试 。 降 
低 的 期 望 是 个 问题 ， 因 为 你 不 知道 某 些 东 西 被 破坏 了 ， 同 样 的 问题 也 出 现在 平台 偏 罗 和 其 他 有 条 件 的 测试 中 。 
所 有 这 些 测试 坏 味 道 都 有 共同 的 症状 ， 不 论 是 在 测试 未 执行 时 宣称 测试 通过 ， 还 是 当 不 检查 任何 事情 时 却 宣称 某 些 行为 通 
， 它 都 误导 你 认为 一 切 正 常 ， 实 则 不 是 。 


Er 


这 样 ， 本 章 的 测试 坏 味道 具有 第 4 章 和 第 2? 章 中 摘 述 的 坏 味道 的 组 合 缺 点 ; 它们 降低 了 可 读 性 且 使 维护 更 加 困难 。 


本 章 对 第 二 部 分 和 测试 坏 味道 目录 做 了 结论 。 在 第 三 部 分 中 我 们 将 转移 注意 力 到 完全 不 同 的 话题 ， 比 如 可 测试 的 设计 ， 以 及 
以 务实 的 方式 用 最 新 最 好 的 技术 去 编写 和 运行 测试。 


第 三 部 分 “” 诊 迄 


本 书 第 三 部 分 的 名 字 曾 经 叫做 “高 级 。 然 而 ， 重 新 考虑 之 后 ， 我 们 觉得 使 用 如 此 强力 的 词语 会 造成 误解 。 于 是 我 们 决定 称 
为 “ 消 遗 ”， 因 为 它 就 是 那样 一 一 一 组 对 高 级 实践 者 有 趣 和 有 用 的 消 遗 ， 但 并 不 是 成 长 为 高 级 实践 者 的 “ 必 读 。 


这 一 部 分 的 话题 是 谈 谈 你 已 经 具备 的 知识 ， 并 朝 11 转 动 旋 钮 ij。 第 7 章 打 开 写 有 “设计 ”标签 的 蠕虫 锥 头 丫 ， 试 图 描绘 是 什 


么 能 构成 (或 不 构成 ) 可 测 的 设计 。 毕 竟 ， 我 们 为 代码 编写 测试 的 能 力 与 设计 代码 的 能 力 紧 密 相 关 。 


第 8 章 我 们 将 船 调转 180 度 ， 探 讨 JVM 语 言 的 共生 ， 以 及 如 果 我 们 用 另 一 门 语言 来 测试 Java 代 码 会 是 什么 样子 。 这 对 于 你 今天 
工作 的 项 目 来 说 可 能 是 个 好 主意 ， 也 可 能 不 是 。 然 而 不 可 否认 的 是 ， 另 类 JVM 语 言 将 占有 一 席 之 地 ， 没 准 儿 哪 天 ， 你 就 会 感谢 自 


己 用 茶 种 语言 写 了 茶 些 测试 。 谁 知道 呢 ! 


这 一 部 分 的 末尾 ， 是 针对 缓慢 构建 的 更 为 实际 的 话题 。 我 们 经 常见 到 项 目的 构建 时 间 变 得 越 来 越 慢 ， 直 到 反馈 回路 变 得 几乎 
无 法 忍受 。 因 此 第 9 章 专门 讨论 对 构建 进行 加 速 ， 既 包括 调整 测试 代码 (通常 这 是 构建 时 间 的 主要 因素 ) ， 又 要 精炼 构建 的 运行 
方式 。 


准备 好 出 发 了 吗 ? 


[1] 11 是 电 吉 他 放大 器 旋钮 的 最 高 档 位 ， 即 音量 最 大 值 。 这 里 指 谈 论 一 些 更 “高 级 ”的 话题 。 


2] 蠕 正 锥 头 在 这 里 比喻 一 大 挫 环 手 的 问题 。 译 者 注 





译 者 注 





第 / 章 ”可 测 的 设计 


在 《实现 模式 》 (Implementation Patterns，Addison Wesley Professional，2007) 的 前 言 中 ，Kent Beck 将 编程 与 美 
国电 视 秀 《Jeopardy》 相 比 。 市 目 中 主持 人 提供 答案 ， 而 参与 者 的 任务 是 猜 答案 所 对 应 的 问题 。“ 一 本 书 最 后 的 一 小 段 。 
“什么 是 后 记 ? ”“ 正 确 。" 


Kent 对 编程 进行 类 比 ， 他 指出 ，Java 以 语言 结构 的 形式 提供 了 答案 ， 而 程序 员 的 任务 就 是 找 出 对 应 的 问题 ， 以 及 用 何 种 语 
言 结构 解决 何 种 问题 。 他 提供 了 一 个 例子 : 如 果 答 案 是 “声明 一 个 集合 字段 ”， 那 么 问题 可 能 是 : “我 如 何 告诉 其 他 程序 员 说 某 
个 列表 是 没有 重复 的 ? 


设计 也 一 样 。 在 学 校 以 及 工作 的 头 几 年 中 ， 我 们 学 到 了 各 种 解决 方案 。 我 们 的 资深 同事 告诉 我 们 “这 里 做 事情 的 方式 ”， 然 
后 我 们 从 所 工作 的 代码 中 拾 起 编程 习惯 ,有 时 也 从 书 中 学 到 一 些 。 但 光 知 道 解决 方案 是 不 够 的 。 我 们 还 要 学 会 识别 它们 所 解决 的 
| 题 。 这 是 本 书 列 举 一 系 列 测试 坏 味 追 的 原因 。 


本 章 主 要 识别 常见 的 妨碍 设计 决策 的 可 测 性 问题 ， 比 如 将 方法 声明 为 static， 以 及 使 用 某 些 语言 结构 比如 final。 我 们 先 讨论 
什么 是 所 期 望 的 “可 测 的 设计 ”， 遵 循 某 些 设计 原则 的 模块 化 设计 ， 以 及 避免 一 些 难以 测试 的 实现 细节 。 然 后 我 们 深入 那些 需 
避免 的 具体 可 测 性 问题 ， 提 出 一 些 用 来 设计 可 测 代 码 的 简单 指导 原则 ， 以 此 来 结束 本 章 。 


7.1 什么 是 可 测 的 设计 


可 测 的 设计 ， 其 基本 价值 主张 是 能 够 更 好 地 测试 代码 。《.NET 单 元 测试 的 艺术 》 一 书 (The Art of Unit Testing with 
Examples in.NET，Manning Publications，2009) 的 作者 Roy Osherove 曾 经 说 过 ，“ 应 当 容 易 和 快速 地 为 一 段 代码 编写 单元 
测试 ”。 更 具体 地 说 ， 对 于 实例 化 各 个 类 、 蔡 换 实现 、 模 拟 不 同 场景 、 调 用 特定 执行 路 径 ， 可 测 的 设计 使 它们 更 加 容易 。 

可 测 性 不 是 非 黑 即 白 的 设计 属性 。 如 Scott Bellware 所 言 ，“ 可 测 性 这 个 术语 不 是 描述 代码 是 否 能 被 测试 。 它 指 的 是 软件 容 
易 被 测试 。”[ 它 指 的 是 程序 员 应 该 能 够 轻而易举 地 在 单元 测试 中 设置 场景 。 设 计 越 不 可 测 ， 程 序 员 编写 测试 越 艰 难 。 问 题 是 ， 
什么 组 成 了 可 测 的 设计 一 一 我 们 如 何 能 产 出 这 样 的 设计 ? 

尽管 你 经 常 听 到 有 人 调侃 软件 开发 还 很 年 轻 ， 然 而 它 却 已 经 有 几 十 年 的 经 验 可 以 借鉴 ， 关 于 如 何 用 不 同 的 编程 范式 来 构建 软 
件 这 个 话题 ， 那 些 经 验 教 给 了 我 们 许多 。 其 中 一 个 就 是 模块 化 设计 的 美妙 之 处 。 


7.1.1 模块 化 设计 


设计 由 不 同 模块 组 合 而 成 ， 每 一 个 都 服务 于 设计 中 的 一 个 特定 目的 ， 正 是 这 种 性 质 使 得 设计 变 得 模块 化 。 通 过 将 程序 的 整体 
功能 分 解 为 不 同 的 责任 ， 并 指派 给 单独 的 组 件 ， 我 们 最 终 得 到 一 个 非常 灵活 的 设计 。 


每 个 单独 的 模块 包含 了 满足 自身 功能 所 需 的 一 切 ， 通 过 将 这 些 分 离 的 模块 组 合成 整体 设计 ， 我 们 引入 各 种 接 缝 ， 并 从 中 构建 
出 灵活 性 。 这 种 编程 风格 强调 模块 之 间 的 依赖 应 尽量 少 ， 如 图 7.1 所 示 。 





图 7.1 模块 化 设计 降低 模块 之 间 的 依赖 


由 小 模块 来 构建 软件 有 助 于 大 产品 团队 中 队员 之 间 的 协作 ， 因 为 产品 的 功能 性 变化 往往 更 多 地 被 隔离 在 代码 的 特定 部 分 。 这 
遵循 了 模块 化 设计 的 特征 ， 系 统 补 分离 为 功能 元 素 ， 其 相应 的 责任 承载 于 特定 的 功能 或 能 力 上 。 


这 种 受到 模块 化 设计 局 友 的 结构 能 使 系统 逐渐 扩展 ， 只 要 模块 本 身 足 够 的 目 包含 和 松 耦合 ， 那 么 仅仅 需要 插入 新 模块 融 能 
变 或 新 增 功能 ， 而 功能 关注 点 分 散在 代码 中 。 这 也 直接 地 有 助 于 可 测 性 ， 因 为 模块 化 设计 的 属性 也 是 使 代码 可 测 的 属性 。 


一 代 又 一 代 的 程序 员 将 这 些 想法 付 诸 实 践 ， 他 们 友 现 那 是 值得 努力 的 有 价值 的 目标 。 但 是 模块 化 设计 的 概念 相当 抽象 。 幸 运 
的 是 ， 我 们 的 先驱 们 已 经 将 来 之 不 易 的 经 验 转化 为 具体 的 设计 原则 ， 使 我 们 容易 记 住 。 


7.1.2 _ SOLID 设计 原则 


大 量 的 设计 原则 已 经 写成 了 文字 。 其 中 最 广 为 流 传 的 一 个 是 SOLID 原 则 。SOLID 由 Robert C.Martin 提 出 ， 是 五 个 设计 原则 
的 首 字 母 缩写 。 


SOLID 等 面向 对 象 设计 原则 的 好 处 在 于 ， 它 们 与 可 测 性 紧密 结合 。 保 持 你 的 代码 遵循 SOLID 设 计 原则 ， 你 就 更 有 可 能 得 到 一 
个 模块 化 的 设计 . 


我 们 束 来 看 看 什么 是 SOLID 原 则 ， 以 及 它们 如 何 提 高 设计 的 可 测 性 。 
单一 职责 原则 


单一 职责 原则 (Single Responsibility Principle，SRP) 是 指 “ 类 发 生变 化 的 原因 应 该 只 有 一 个 ”。 换 句 话 说 ， 类 要 小 而 专 
注 ， 并 具有 高 内 聚 。 不 止 如 此 ， 方 法 应 该 只 有 一 个 变化 的 原因 。 这 就 是 Sandro Mancuso 所 称 的 内 部 视角 。 吕 | 


遵循 SRP 的 代码 容易 处 理 和 理解 ， 反 过 来 使 得 它 容易 测 试 ， 因 为 编写 测试 本 质 上 是 在 指定 期 望 的 行为 ， 表 达 对 代码 要 解决 的 
问题 的 理解 。 甚 至 ， 从 内 部 视角 看 ， 方 法 的 复杂 性 越 低 ， 完 整 测试 所 需 的 复杂 性 越 低 。 


开 闵 原则 


开 闭 原则 (Open-Closed Principle，OCP) 认为 类 应 当 “ 对 扩展 开放 ， 但 对 修改 关闭”。 尽 管 听 起 来 很 抽象 ， 其 实 残 是 况 
在 不 改变 源 代码 的 情况 下 去 改变 类 的 行为 ， 例 如 ， 蔡 换 不 同 的 策略 。 


类 将 具体 责任 委托 给 其 他 对 象 ， 可 以 使 得 测试 在 需要 模拟 具体 场景 时 车 换 一 个 测试 茶 身 。 
里 氏 蔡 换 原 则 


里 氏 奉 换 原 则 (Liskov Substitution Principle，LSP) 是 指 “ 子 类 应 该 能 蔡 换 挥 父 类 ”。 也 束 是 ， 使 用 类 A 实例 的 代码 ， 如 
果 传 入 其 子 类 B 的 话 ， 它 还 能 正常 工作 。 


LSP 是 关于 合理 仓 在 的 类 继承 天 系 ， 它 体现 为 有 效 的 抽象 ， 而 不 仅仅 是 为 了 方便 而 进行 的 代码 复 用 。 尽 管 从 可 测 性 角度 看 ， 
它 在 SOLID 原 则 中 不 是 最 重要 的 ， 但 违反 LSP 也 意味 着 尝 疝 测试 的 程序 员 受 到 束缚 。 遵 循 LSP 的 类 继承 天 系 通过 使 用 契约 测 
试 _ (contract test) 来 提高 可 测 性 一 一 为 一 个 接口 编写 的 测试 ， 可 以 用 于 该 接口 的 所 有 实现 。 


接口 隔离 原则 


接口 隔离 原则 (Interface Segregation Principle，ISP) 表明 “许多 具体 的 客户 接口 要 好 过 一 个 宽泛 的 接口 ”。 简 言 之 ， 
你 应 该 保持 接口 小 而 专注 。| 


小 接口 改善 可 测 性 的 方式 ， 束 是 使 其 更 容易 编写 测试 和 使 用 测试 蔡 身 。 例 如 ， 一 个 测试 可 能 希望 对 协作 者 A 打桩 ， 假 冒 协 作 
者 B， 将 协作 者 C 奉 换 为 间谍 。 如 果 每 个 协作 者 拥有 自己 的 小 接口 的 话 ， 束 可 以 直接 去 实现 测试 替身 。 


依赖 反 转 原则 


第 五 个 SOLID 原 则 是 依赖 反 转 原则 (Dependency Inversion Principle，DIP) ， 是 说 代码 应 该 “依赖 于 抽象 ， 而 非 细 
石 ”。 极 端 地 说 ，DIP 认 为 类 不 应 该 实例 化 目 己 的 协作 者 ， 而 是 传 入 它们 的 接口 。 


对 于 编写 测试 ， 传 入 协作 者 而 不 是 有 选择 地 覆 苹 某 些 代码 ， 这 种 威力 是 巨大 的 。 这 种 依赖 注入 是 可 测 性 的 福音， 因为 不 仅 可 
以 替换 协作 者 ,而且 可 以 书 约 工作 量 : 测试 使 用 代码 的 方式 与 生产 环境 中 一 样 。 


设计 模式 ， 并 能 预见 具体 实现 及 其 影响 。 你 逐渐 积累 了 足够 的 精神 食粮 ， 学 会 了 将 代码 匹配 到 杠 


验 。 


重要 的 是 程序 员 理 解 单 见 
式 ， 并 能 够 利用 那些 知识 和 经 


7.1.3 上 下 文中 的 模块 化 设计 


现实 中 没 那么 容易 ， 因 为 尽管 我 们 很 善于 针对 要 解决 的 问题 去 识别 合适 的 实现 方式 ， 我 们 却 也 应 该 能 够 从 整体 上 设想 那些 解 
决 方案 一 一 从 代码 角度 将 那些 小 组 件 拉 到 一 起 。 发 明了 万 维 网 的 Tim Berners Lee 曾 针对 设计 原则 写 过 如 下 一 段 话 : “不 仅 需 要 
确保 你 的 系统 是 按照 模块 化 来 设计 的 。 同 时 也 要 意识 到 ， 无 论 系 统 现 在 有 多 么 巨大 和 美好 ， 应 该 总 是 将 其 设计 成 男 一 个 更 大 系统 
的 一 部 分 。” 约 

换 句 话说 ， 模 块 化 并 没有 那么 美好 ， 除 非 设计 符合 你 设想 的 使 用 和 成 长 方式 。 今 儿 你 算 赶 上 这 挨 儿 了 一 一 我 正好 有 一 些 手 
有 &， 能 更 加 容易 地 实现 模块 化 设计 ， 同 时 遵循 常见 的 设计 原则 ， 且 在 大 型 上 下 文中 表现 民 好 。 


7.1.4 以 测试 驱动 出 模块 化 设计 
用 测试 来 驱动 代码 ， 这 是 借鉴 模块 化 设计 的 最 快手 段 。 实 现代 码 之 前 先 写 测试 ， 这 本 来 就 是 一 种 确保 你 从 客户 视角 来 塑造 代 
码 的 方式 。 也 就 是 说 你 得 到 的 设计 更 加 有 可 能 满足 目标 。 而 且 ， 设 计 的 可 测 性 是 不 成 问题 的 。 


鼓励 模块 化 设计 的 不 仅仅 是 TDD 中 测试 先行 的 概念 。TDD 实 践 者 也 频繁 地 重 构 代码 ， 持 续 地 分 解 过 大 的 方法 ， 引 入 更 好 的 
抽象 ， 并 移 除 重复 。)B.Rainsberger 在 他 的 文章 《简单 设计 的 四 个 要 素 》 中 提 到 ， 最 小 化 重复 和 最 大 化 清晰 度 是 如 何 带 来 模块 
化 设计 的 。 

有 许多 技术 和 手段 可 供 学 习 模 块 化 设计 。 这 只 是 一 道 选择 题 ， 那 就 是 你 是 否 足够 在 意 你 的 代码 ， 并 采用 有 纪律 的 实践 ， 比 如 
测试 驱动 开发 和 大 胆 的 重 构 。 

现在 来 看 看 阻止 我 们 得 到 可 测 设计 的 一 些 常见 障碍 。 


[1] Scott Bellware ，Good Design is Easily-Learned, 2009.1.12 , http://mng.bz/IAMK. 

D] 见 《SRP: 简单 性 与 复杂 性 》 (SRP: Simplicity and Complexity) ，2011.7.26 ，http://mng.bz/08ks。 

[3] 听 起 来 耳 熟 吗 ? 我 曾 听 无 意 听 到 有 人 认为 ISP 是 “针对 接口 的 SRP”。 

[和 Tim Berners-Lee，《 设 计 原 则 》 (Principles of Design) ， 最 后 更 新 于 2010 年 3 月 2 日 ，http://www.w3.org/Designlssues/ 
Ptinciples.html。 

[5] ”The Four Elements of Simple Design  , J.B. Rainsberger, 2009, http://www.jbrains.ca/permalink/ the-fout-elements-of simple- 


design. 


7.2 可 测 性 的 占 题 


程序 员 在 费力 地 编写 测试 时 ， 通 常会 面 对 一 些 障碍 。 它 们 大 多 数 属 于 两 类 : 访问 受 限 ， 以 及 无 法 蔡 损 实现 的 某 些 部 分 。 尽 管 
许多 方式 都 会 导致 可 测 性 不 够 理想 ， 但 很 多 时 候 首 先 要 克服 的 郸 是 一 件 小 事 ， 那 就 是 无 法 在 测试 中 实例 化 某 个 类 。 


7.2.1 无 法 实例 化 某 个 类 


程序 员 编 写 测试 时 ， 往 往 要 做 的 第 一 件 事情 束 是 实例 化 某 些 对 象 。 有 时候 无 法 实例 化 被 测 对 象 ， 但 更 常见 的 是 无 法 实例 化 那 


个 要 传 入 局 测 对 象 的 协作 者 。 


这 多 见于 没有 考虑 可 测 性 的 第 三 方 库 ， 但 有 时 你 也 只 能 责怪 自己 。 一 般 来 说 ， 你 曾 过 于 保守 地 处 理 可 见 性 修饰 符 ， 现 在 编译 
器 指出 了 这 种 短视 ， 出 来 混 总 是 要 还 的 。 


无 法 用 构造 冰 数 去 实例 化 类 的 另 一 个 常见 原因 是 静态 初始 化 的 代码 块 ， 它 会 假设 你 运行 在 成 熟 的 生产 环境 中 ， 那 会 导致 在 运 
行 测 斌 时 出 现 完全 无 法 预期 的 异常 。 例 如 ， 考 虑 以 下 破坏 可 测 性 的 代码 片段 : 
public class DocumentRepository { 


private static final String API KEY = "d869db7fe62fb07c",; 
private static String sessionToken:; 


Statie 4 
String serverHostName = System.getenv ("ACL SERVER_HOST'" ) ; 
SessionClient api = new SessionClientImpl (serverHostName).; 
sessionToken = apl.openSession(API KEY).,， 

} 

public DocumentRepository() { 


} 


在 笔记 本 电脑 上 将 试 在 测试 中 实例 化 这 个 类 时 ， 你 很 容易 因为 没有 设置 ACL_ SERVER_HOST 环 境 朗 量 而 全 到 
NullPointerException， 或 者 因为 你 的 笔记 本 电脑 不 能 够 穿 过 防火 墙 连 到 实验 室 中 的 真实 服务 器 而 磁 到 
UnknownHostException。 这 种 依赖 司空 见 惯 。 真 正 的 问题 在 于 ， 依 赖 是 硬 编码 在 静态 初始 化 代码 块 中 的 ， 你 无 能 为 力 。 
7.2.2 ”无 去 调用 某 个 方法 

即使 所 有 对 象 都 实例 化 完毕 ， 你 的 测试 还 是 会 在 执行 所 需 的 交互 或 场景 时 熄火 。 例 如 ， 你 会 想 要 调用 一 个 标记 为 private 的 
方法 。 这 又 是 可 见 性 修饰 符 过 于 保守 的 问题 ! [1 


无 法 调用 所 需 方法 的 另 一 个 原因 可 能 是 它 的 透明 度 ， 你 无 法 找 出 方法 期 望 接受 的 参数 。 特 别 是 依赖 于 好 用 却 古老 的 
java.utiMap 时 。 尽 管 那 是 “灵活 ”的 API， 但 却 带 来 了 一 些 严重 问题 。 你 无 法 一 眼 就 看 出 Map 应 当 包含 的 内 容 ， 因 而 不 得 不 查 
看 源 代码 或 文档 ， 于 是 拖 慢 了 你 的 脚步 。 对 于 你 想 要 直接 测试 的 private 方 法 也 是 一 样 。 除 非 你 重 构 设计 ， 否 则 只 剩 两 种 糟糕 的 
选择 : 不 测试 它 ， 或 者 和 佘 出 反射 (Reflection) API 来 绕 过 可 见 性 修饰 得 。 


7.2.3 ”无 去 观察 到 输出 


即使 你 有 办 法 调用 到 想 要 的 方法 ， 你 仍 可 能 难以 确定 乙 后 友 生 的 事情 是 否 正确 。“hello world” 单 元 测试 只 是 调用 一 个 方 
法 ， 然 后 断言 返回 值 的 内 容 。 但 是 如 果 方 法 与 协作 对 象 区 互 ， 或 者 作为 void 方法 根本 不 返回 任何 值 ， 事 情 融 变 得 环 手 了 。 


有 了 时 你 友 现 自己 无 法 拦截 感 兴趣 的 交互 。 这 可 能 是 因为 协作 者 与 被 测 方 法 紧 紧 地 缠 在 一 起 ， 而 无 法 用 测试 替身 来 替换 。 另 
外 ， 被 测 方 法 的 奔 烦 源 于 它 虽 然 启 动 了 线程 ， 但 测试 代码 却 不 能 拦截 到 线程 的 执行 


这 与 其 他 主要 的 可 测 性 问题 有 干 丝 万 缕 的 联系 : 难以 有 选择 地 替换 实现 的 某 些 部 分 。 


7.24 无 法 茶 换 肝 个 协作 者 


无 法 替换 协作 者 是 一 个 常见 的 可 测 性 问题 。 可 能 是 由 于 生产 代码 包含 了 硬 编码 的 New Collaborator()， 而 你 却 想 用 特定 的 协 
作者 来 测试 该 交互 。 换 句 话说 ,你 错失 了 一 个 用 于 拦截 和 观察 交互 的 “ 接 颖 ”。 技 术 上 来 说 你 不 能 替换 挥 协作 者 。 


尽管 这 种 硬 编码 的 协作 者 实现 着 实 大 频繁 而 且 极 度 不 便 ， 但 或 许 更 常见 的 是 那样 一 种 结构 ， 虽 然 能 够 替换 掉 协 作者 ， 但 却 市 
来 不 必要 的 艰难 。 那 种 结构 有 时 称 为 方法 链 : getCollaborator().doStuff().askForStuff(.doMoreStuff()。 [a 


束 算 你 能 蔡 换 挥 协 作者 ， 这 样 一 条 万 法 链 意 味 着 你 的 测试 替身 需要 返回 另 一 个 测试 替身 ， 而 它 又 要 返回 另 一 个 测试 蔡 身 .……. 


NaV=—al 
) 又 元 ) 又 了 | 


7 2 大 去 全 关 时 小 方 去 


将 协作 者 蔡 换 为 测试 蔡 身 ， 在 编写 单元 测试 时 是 一 个 至 关 重 要 的 工具 。 但 它 不 是 唯一 的 工具 : 有 时 你 不 想 蔡 换 协 作者 ， 而 是 
锌 测 对 象 的 一 部 分 。 比 如 下 列 万 法 ， 测 试 调用 它 来 获取 协作 者 : 


orivate statio Funal ColLlaborator vetCol Laborator 1 tT ,a 4 


现在 ， 全 部 三 个 关键 字 (private、final、static) 基本 上 宣判 了 你 不 能 够 在 测试 中 做 这 件 事 : 


GTest 
DuolIe VoLd test(}) 
final Collaborator collaborator = new TestDouble(); 
ObjectUnderTest o = new ObjectUnderTest() { 
QOverride 
ELITEG tale Final veteoolLiaboratorl} 1 
return collaborator; 


} 


你 不 能 那样 做 ， 因 为 编译 器 不 允许 覆盖 一 个 fina| 方 法 ， 即 使 private 或 staticb 也 不 行 。 你 又 一 次 只 能 在 糟 与 更 糟 之 间 选 择 ， 
并 引入 重量 级 的 反射 和 字 节 人 码 操 作 一 一 都 不 是 我 们 想 要 的 。 


年 复 一 年 地 面 对 这 尝 可 测 性 问题 ， 我 对 于 可 测 的 设计 有 了 一 些 简单 的 领悟 一 一 指导 方针 。 我 们 来 看 一 看 。 


[1] 这 种 情况 下 ， 我 认为 真正 的 问题 是 私有 方法 应 当 是 新 类 的 公有 方法 。 显 然 它 已 经 足够 复杂 了 ， 否 则 你 不 会 想 要 直接 测试 它 。 

[2] 这 种 情况 触及 迪 米 特 法 则 (Law of Demetet) ， 警 告 说 代码 对 其 他 代码 了 解 得 太 多 了 。 参 见 
http://en.wikipedia.org/wiki/Law_of_ Demeter。 

[3] 注意 ，static 方法 可 以 被 子 类 隐藏 。 但 那 与 惟 盖 (ovettiding) 不 同 ， 这 与 我 们 要 探讨 的 无 关 。 


7.3 ”可 测 的 设计 的 指南 


下 列 是 我 收集 的 一 些 该 做 与 不 该 做 的 ， 在 不 断 薄 羊毛 (1 的 过 程 中 ， 我 体会 到 了 它们 的 重要 性 。 人 它们 没有 特定 的 次 序 ， 也 没 
有 哪个 是 放 之 四 海 皆 准 的 一 一 仅仅 记 住 这 些 指导 方针 就 行 了 ， 三 思 而 后 行 。 


e 责 声明 之 后 ， 咱 们 开始 一 些 针 对 前 述 章节 的 指导 方针 。 


7.3.1 ”避免 复杂 的 私有 方法 


没什么 好 办 法 去 测试 private 方 法 。 因 此 ， 你 应 该 尽量 避免 直接 测试 private 方 法 。 


注意 我 并 不 是 说 你 不 该 测试 private 广 法， 而 是 你 要 避免 直接 测试 它 。 只 要 那些 方法 短小 好 记 ， 并 有 助 于 public 方 法 更 容易 
阅读 ， 那 么 仅 通 过 Public 方 法 来 测试 它们 也 融 没 问题 了 。 


当 private 方 法 不 那么 直截了当 ， 并 且 你 党 得 需要 为 它 写 测 试 时 ， 你 应 该 重 构 代码 ， 将 private 方 法 封装 的 逻辑 转移 到 另 一 个 
对 象 中 ， 成 为 一 个 public 方 法 。 


7.3.2 ”避免 final 方 法 


很 少 有 程序 需要 final 方 法 。 而 你 其 实 也 并 不 需要 它 。 


将 方法 声明 为 final 的 主要 目的 是 确保 它 不 会 被 子 类 覆盖 。Oracle Technology Network 上 关于 Java 安 全 编码 指南 的 文 
章 B 提 到 : “将 类 声明 为 final， 可 以 阻止 恶意 的 子 类 去 添加 终结 器 (finalizer) 、 复 制 和 重 载 随机 方法 。” 


尽管 那 在 某 些 上 下 文中 是 成 立 的， 但 你 不 见得 就 应 该 使 用 final 修 饰 符 。 该 逻辑 有 两 个 问题 。 首 先 ， 那 些 潜在 的 子 类 很 可 能 
束 是 你 身边 的 人 写 的 。 其 次 ， 反 射 API 可 以 用 于 去 除 final 修 饰 待 。 实 际 上 ， 将 方法 声明 为 final 的 唯一 合理 情形 就 是 当 你 在 运行 期 
加 载 外 部 类 的 时 候 ， 或 者 你 不 信任 同事 ( 听 上 去 你 有 个 更 大 的 问题 要 担心 ) 。 


你 可 以 添加 第 三 种 情形 : 不 相信 你 自己 。 例 如 ， 在 实现 模板 方法 模式 向 的 具体 类 中 ， 你 担心 自己 不 小 心 覆盖 了 错误 的 方法 。 
即便 如 此 ， 你 的 测试 应 该 快速 地 捕获 到 这 个 错误 。 (并 且 如 果 你 真 的 有 点 偏执 的 话 ， 你 可 以 鼓 足 干劲 ， 编 写 一 个 契约 测试 来 检查 
对 反射 API 的 使 用 是 否 恰当 。 ) 


最 大 的 问题 在 于 : final 关 键 子 是 否 妨碍 了 你 的 测试 ， 如 果 是 的 话 ， 权 衡 一 下 糟糕 的 可 测 性 审 来 的 负担 与 使 用 final 市 来 的 好 
训 轻 训 重 。 


学 


final 的 性 能 如 何 ? 
对 于 支持 fnal 方 法 ， 人 们 的 论点 之 一 就 是 其 性 能 。 也 就 是 说 ， 由 于 final 方 法 无 法 被 履 盖 ， 那 么 编译 器 可 以 内 联 (inline) 该 方 
法 的 实现 来 优化 代码 。 
事实 证 明 编 译 器 无 法 安全 地 内 联 ， 因 为 方法 可 能 会 在 运行 期 带 有 非 final 的 声明 。 但 J[T 编 译 器 将 能 在 运行 期 内 联 这 种 函数 ， 带 


来 一 种 理论 上 的 性 能 优势 。 


《Java Performance Tuning，2nd Edition》 (O Reilly Media，2003 年 1 月 ) 的 作者 Jack Shirazi 和 Kitk Pepperdine 说 道 : “我 不 会 


纯粹 因为 性 能 原因 而 将 方法 或 类 声明 为 final。 只 有 当 你 真 的 识别 出 性 能 问题 之 后 ， 再 去 考虑 它 。 


7.3.3 ”避免 static 方 法 


大 多 数 static 万 法 是 没有 必要 的 。 一 般 来 说 ， 编 写 这 种 方法 是 因为 它们 与 特定 类 实例 无 天 ， 或 是 弄 不 清楚 它 的 归属 ， 于 是 我 
们 将 其 声明 为 公用 (utility) 类 中 的 静态 方法 。 前 一 个 动机 丫 得 住 脚 ， 但 后 一 个 却 是 纯粹 的 无 关 或 缺乏 兴趣 。 还 有 一 个 不 笠 却 单 
见 的 原因 ， 是 静态 方法 更 容易 进行 全 局 访问 。 


某 些 方法 天 生 就 是 静态 的 。 例 如 ， 执 行 数字 计算 的 公用 方法 适合 作为 static 方 法 。 如 何 区 分 某 个 方法 是 否 该 是 静态 的 ? 或 许 
代码 清单 7.1 中 的 例子 有 助 于 理 清 思路 。 


代码 清单 7.1 避免 将 可 能 会 打桩 的 方法 声明 为 static 方 法 
public static int rollDie(int sides) { 


return 1 + (int) (Math.random() * sides): 


} 
rollDie() 方 法 产生 随机 结果 ， 模 拟 你 掷 特定 面 数 (sides) 的 山子 Pl。 应 当 避 免 在 自动 化 测试 中 处 理 随机 因素 ， 因 此 你 会 想 要 
在 测试 中 为 rollDie() 方 法 打桩 (stub) 。 


我 的 头号 规则 是 ， 对 于 某 个 万 法 ， 如 果 你 预见 到 你 将 会 在 单元 测试 中 为 其 打桩 ， 那 束 不 要 将 其 声明 为 static。 事 实 上 ,我 很 
少 会 为 纯粹 的 运算 来 打桩 。 另 外 ， 对 于 作为 某 个 服务 或 协作 对 象 的 入 口 点 的 静态 方法 ， 我 友 现 自己 经 常 想 要 为 其 打桩 。 


声明 为 static 的 各 种 方法 都 要 引起 注意 。 静 态 方 法 虽 容 易 编 写 ， 但 将 来 在 测试 中 为 其 打桩 融 会 很 痛 吉 。 相 反 ， 还 是 创建 对 
象 ， 通 过 其 实例 方法 来 提供 功能 吧 。 


7.3.4 ”使 用 new 时 要 当心 


关键 字 new 是 最 常见 的 硬 编码 形式 。 每 次 你 “新 建 ” 一 个 对 象 ， 你 束 已 经 毅 定 了 具体 实现 。 因 此 ， 在 方法 中 进行 实例 化 的 对 
象 ， 应 该 仅 限 于 不 会 蔡 换 为 测试 蔡 身 的 对 象 。 代 码 清单 7.2 指 出 了 这 种 模式 。 


代码 清单 7.2 ”关键 字 new 对 实现 类 进行 了 硬 编码 


public String createTagName (String topic) { 
Timestamper c = new Timestamper(); 
return topic + c.timestamp(); 


代码 清单 中 的 方法 基于 给 定 的 输入 和 时 间 戳 来 构建 字符 串 ，Timestamper 在 方法 中 得 到 实例 化 ， 并 生成 了 那个 时 间 戳 。 


对 崇尚 测试 的 程序 员 来 说 ，static 和 0final 是 一 种 警示 ， 但 许多 程序 员 并 不 认为 new 也 是 其 中 之 一 。 这 不 能 使 其 完全 地 脱 开 干 
系 ， 因 为 测试 无 法 覆 苹 被 测 方 法 中 的 特定 实例 。 例 如 ， 代 码 清 单 7.2 中 的 Timestamper。 


当 实 例 化 对 象 时 ， 你 应 该 问 问 目 己 : 这 个 对 象 是 不 是 会 在 测试 中 被 置换 出 去 ? 如 果 它 真 的 是 个 协作 对 象 ， 而 且 在 不 断 测试 的 
过 程 中 ， 你 有 可 能 要 改变 其 实现 ， 那 么 它 应 当 被 传 入 那个 方法， 而 不 是 在 方法 中 进行 实例 化 。 
7.3.5 ”避免 在 构造 图 数 中 包含 逻辑 

构造 溺 数 很 难 绕 过 去 ， 因 为 子 类 的 构造 冰 数 至 少 会 触 友 超 类 一 个 的 构造 尔 数 。 因 此 ， 你 应 当 避 免 在 构造 肖 数 中 放置 严重 需要 
测试 的 代码 或 逻辑 。 

代码 清单 7.3 包 合 一 个 精心 设计 的 全 球 唯一 标识 得 (Universally Unique ldentifier，UUID) 实现 ， 它 由 生成 的 计算 机 MAC 
地 址 和 时 间 蕉 组 成 。 


代码 清单 7.3 ”构造 销 数 中 做 了 太 多 事情 


BUblLLie :GLasgs UUID | 
private String value,; 


DUBLie VUIDI) 1 
// First, obtain the computer's MAC address by 
// running ipconfig.exe and parsing its output 


long macAddress = 0; 
Process p = Runtime.getRuntime() .exec ( 
ew :Serams[ll € Townmtiog",. al FT. NLL 


BufferedReader in = new BufferedReader ( 
new InputStreamReader (p.getInputStream())).; 
String line = null; 


while (macAddress == null && 
(line = in.readLine()) ‘i'= null) { 
macAddress = extractMACAddressFrom(line): 


} 


// Obtain the UTC time and rearrange 

// its bytes for a version 1 UUID 

long timeMillis = (System.currentTimeMil1llis() * 10000) 
+ Ox01B21DD213814000L:; 

long time = timeMillis << 32; 

time |= (timeMillis & OxFFFFO0O0000000L) >> 16; 


time |= 0x1000 | ((timeMillis >> 48) & OxOFFF),; 


假如 你 要 测试 代码 清单 7.3 中 的 UUID 类 。 看 着 它 庞大 的 构造 函数， 你 已 碰 到 了 一 个 可 测 性 问题 : 你 只 能 在 Windows 计 算 机 
上 实例 化 这 个 类 (或 其 子 类 ) ， 因 为 它 试 图 执行 ijpconfig/all。 我 磁 I5 在 Mac 上 运行 它 ， 结 果 栽 了 ! 


更 好 的 方式 是 ， 将 所 有 代码 抽取 到 可 以 被 子 类 黎 关 的 protected 方 法 中 ， 如 代码 清单 7.4 所 示 。 
代码 清单 /.4 将 逻辑 从 构造 冰 数 中 移 到 辅助 的 protected 方 法 中 


publie class UUID { 
private String value; 


public UUID(Y) { 
long macAddress = acquireMacAddress (); 
long timestamp = acquireUuidTimestamp(); 
value = composeUuidStringFrom(macAddress, timestamp); 


} 


protected long acquireMacAddress() { ... } 
protected long acquireUuidTimestamp() { ... } 


private static String composeUuidStringFrom!\( 
long macAddress, long timestamp) { ... } 


代码 清单 7.4 按 此 修改 之 后 ， 无 论 运行 在 哪 种 操作 系统 上 ， 你 都 可 以 任意 地 覆 蘑 指定 代码 ， 以 便 在 测试 中 实例 化 UUID 对 象 : 


@Test 
DUuDlG wood test(ly + 
UUID uuid = new UUID() { 


QOverride 
protected long acquireMacAddress() { 
return 0; // bypass actual MAC address resolution 


} 


| 
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忌 而 言 之 ， 对 于 构造 消 数 中 的 任何 代码 ， 确 保 你 不 会 想 要 在 单元 测试 中 蔡 换 它们 。 如 果 友 现 了 这 种 代码 ， 最 好 将 其 移动 到 某 
个 方法 中 ， 或 者 移动 到 某 个 你 可 以 覆盖 的 方法 中 ， 或 者 参数 对 象 (parameter object) 中 。 上 | 


7.3.6 “避免 单 例 


里 例 (Singleton) 模式 市 来 的 烂 代码 耗费 了 软件 工业 数 以 百 万 计 的 美元 。 它 曾 是 一 种 为 了 “确保 类 只 有 一 个 实例 ， 并 提供 
全 局 访问 点 ”而 设计 出 的 模式 。 在 我 看 来 ， 你 根本 丈 不 需要 它 。 


的 确 在 有 些 情 况 下 ， 你 只 需要 在 运行 期 保留 类 的 一 个 实例 。 但 是 单 例 模 式 往往 也 妨碍 了 测试 去 创建 不 同 的 变 体 。 我 们 看 看 传 
统 的 单 例 实现 方式 ， 见 代码 清单 7.5。 


代码 清单 7.5 ”传统 的 单 例 实现 方式 
PUTie Class CloGck 1 


private static final Clock singletonIinstance = new Clock(); 


// private constructor prevents instantiation from other classes 
private Clock() { } 


public static Clock getInstance() { 
return singletonInstance; 


} 


将 构造 浮 数 声明 为 private 并 限制 访问 getinstance0 广 法， 基本 上 意味 着 一 旦 你 实例 化 出 Clock 实 例 后 ， 残 无 法 替换 掉 它 。 
这 是 个 大 问题 ， 因 为 每 当 你 想 测 试 使 用 Clock 单 例 的 代码 时 ， 都 束手无策 : 


public class Log { 
public void log(String message) { 


String prefix = "[" + Clock.getInstance() .timestamp() + "] "; 
logFile.write(prefix + message) ; 


每 一 处 要 测试 的 代码 ， 都 是 通过 静态 的 Singleton 访 问 器 来 获取 Clock 实 例 ， 你 只 能 通过 反射 来 向 Singleton 类 注入 新 的 
Singleton 实 例 (你 不 会 想 在 测试 中 使 用 反射 的 ， 或 者 添加 setter 方 法 来 进行 注入 。 


斑 存 的 蛙 例 


如 果 你 发 现 一 个 静态 的 单 例 访问 器 ， 考 虑 使 单 例 的 getInstance0 方 法 返回 一 个 接口 ， 而 非 有 具体 类 。 当 你 无 需 从 具体 类 继承 的 
时 候 ， 接 口 是 更 加 容易 伪造 的 ! 


更 佳 和 更 为 可 测 的 设计 ， 是 不 强制 唯一 实例 的 单 例 (singleton) [1， 而 是 依赖 于 程序 员 的 “我 们 只 会 在 生产 环境 中 实例 化 


出 一 个 对 象 ”的 约定 。 毕 竟 ， 如 果 你 仍然 需要 提防 猪 一 样 的 队友 ， 那 么 更 大 的 矿 烦 其 实 人 在 等 着 你 。 


7.3.7 ”组 合 优 于 继承 
为 了 重用 而 继承 ， 束 好 比 杀 鸡 用 牛刀。 继承 确实 允许 重用 代码 ， 但 也 带 来 了 严格 的 类 继承 关系 ， 抑 制 了 可 测 性 。 


让 Google 的 整洁 代码 传道 者 Misko Hevery 来 解释 这 个 问题 的 症结 所 在 。 [| 


继承 关键 在 于 利用 多 态 行为 而 非 重 用 代码 ， 而 人 们 对 此 常常 误解 。 他 们 将 继承 看 做 是 向 类 添加 行为 的 廉价 方式 。 当 我 设计 代 
码 时 ， 我 会 考虑 多 种 选择 。 而 当 使 用 继承 时 ， 就 会 减少 我 的 选择 。 我 现在 成 为 菜 个 类 的 子 类 ， 那 我 就 不 能 再 成 为 其 他 类 的 子 类 。 
我 永久 地 将 构造 通 数 国定 在 那个 父 类 上 ， 父 类 改变 API 时 我 只 能 任 其 摆布 。 在 编译 期 我 就 已 失去 了 变化 的 自由 。 


另 一 方面 ， 组 合 给 了 我 多 种 选择 。 我 并 不 需要 调用 父 类 。 我 可 以 重用 不 同 的 实现 (本 该 重用 父 类 方法 的 ) ， 我 可 以 在 运行 其 
多 态 


改变 主意 。 这 就 是 我 尽量 使 用 组 合 而 非 继承 的 原因 。 (但 是 只 有 继承 才能 提供 多 态 。) 


注意 MsSKo 并 不 是 说 继承 不 好 ， 为 了 多 态 的 继承 绝对 没 问题 。 但 是 如 果 你 打算 重用 功能 ， 那 最 好 还 是 通过 组 合 来 实现 ; 使 
用 另 一 个 对 象 而 不 是 继承 它 的 类 定义 。 


7.3.8 封 半 外 部 库 


不 是 所 有 人 都 像 你 一 样 擅长 提出 可 测 的 设计 。 考 虑 到 这 一 点 ， 请 极其 谨慎 地 继承 第 三 万 外 部 库 ， 在 直接 调用 外 部 库 之 前 要 三 


包 
oo 


我 们 已 经 触及 继承 市 来 的 可 测 性 问题 。 从 外 部 库 中 继承 往往 更 糟 ， 因 为 你 很 难 控制 被 继承 的 代码 。 不 论 是 继承 或 是 直接 调 
用 ,与 外 部 库 的 代码 纠缠 越 多 ， 你 越 需 要 外 部 类 对 测试 友好 。 


注意 外 部 API 库 中 类 的 可 测 性 ， 如 果 你 看 到 警示 ， 记 得 自行 设计 一 套 测 试 友 好 的 接口 ， 用 其 将 外 部 库 包 裹 起 来 ， 以 便 容 易 地 
茶 换 挥 实际 的 实现 。 
无 法 改变 设计 
因为 你 受到 不 可 测 的 设计 的 困扰 ， 而 且 你 无 法 使 设计 变 得 更 可 测 ， 因 此 你 不 时 地 会 纠结 于 该 如 何 是 好 。 尽 管 你 看 到 的 代码 从 
技术 上 讲 是 “你 的 ，， 但 这 种 情况 与 外 部 库 并 无 不 同 ， 也 就 是 你 难以 控制 它 。 因 此 ， 处 理 这 种 可 测 性 挑战 的 方式 也 是 类 似 的 : 将 
不 可 测 的 代码 包 襄 在 落 薄 一 层 可 测 的 代码 之 中 。 


7.3.9 ”避免 服务 查找 


大 多 数 服 务 查 找 〈 比 如 调用 静态 万 法 来 获取 单 例 实 例 ) ， 是 在 看 似 干 将 的 接口 与 可 测 性 之 间 所 做 的 糟糕 权衡 。 接 口 只 是 看 起 
来 干净 ， 因 为 那些 无 法 明确 作为 构造 浮 数 参数 的 依赖 ， 现 在 却 隐藏 在 类 中 。 在 测试 中 蔡 换 那 依赖 从 技术 上 讲 不 是 不 可 能 ， 但 是 需 
要 更 多 的 工作 才能 做 到 。 


我 们 看 一 个 例子 。 代 码 清 单 7.6 展 示 了 一 个 类 ， 它 负责 通过 APIClient 向 Web 服 务 友 出 远程 搜索 请 求 。 


代码 清单 /7.6 ” 相 比 构造 消 数 参数 ， 服 务 查 找 更 难 打桩 


public class Assets { 
public Collection<Asset> search(String... keywords) { 
APIRequest searchRequest = createSearchRequestFrom(keywords).; 
APICredentials credentials = Configuration.getCredentials () ; 
APIClient apl = APIClient .getIinstance (credentials).; 
return api.search (searchRequest).; 


} 


private APIRequest createSearchRequestFrom(String... keywords) ({ 
// omitted for brevity 


注意 search() 方 法 是 如 何 利用 服务 得 找 来 获取 APIClient 的 。 访 设计 并 没有 按照 我 们 的 想法 驱动 出 可 测 性 。 代 码 清单 7.7 展 示 
了 如 何 为 那个 对 象 写 测 试 。 


代码 清单 7.7 为 服务 查找 打桩 意味 着 一 个 额外 步 台 


@Test 

public void searchingByKeywords() { 
final String[] keywords = {"one", "two", "three")} 
final Collection<Asset> results = createListOfRandomAssets ( ) ; 
APIClient.setIinstance (new FakeAPIClient (keywords, results)).; 
Assets assets = new ASSetsS () ; 


assertEquals (results, assets.search (keywords)).; 


按照 Assets 中 的 服务 查找 所 暗示 的 间接 万 式 ， 我 们 通过 人 额外 的 步骤 来 配置 服务 查找 提供 者 (APlIClient) ， 令 其 在 被 请 求 时 
返回 我 们 的 测试 蔷 身 。 尽 管 这 在 测试 代码 中 只 体现 了 一 行 ， 但 却 暗示 了 和 在 APIClient 中 存在 好 几 行 代码 ， 它 们 仅仅 用 来 修补 可 测 


ee 


性 问题 。 


现在 ， 我 们 换个 方式 作为 对 照 ， 使 用 构造 亢 数 将 测试 蔡 身 直接 注入 APIClient 中 。 代 码 清单 7.8 展 示 了 测试 的 样子 。 


代码 清单 /.8 ”构造 冰 数 参数 更 加 容易 蔡 换 


@Test 
public void searchByOneKeyword() { 
final String[] keywords = {"one", "two", "three")} 
final Collection<Asset> results = createListOfRandomAssets();} 


Assets assets = new Assets (new FakeAPIClient (keywords, results)).; 
assertEaquals (results, assets.search (keywords)).; 


再 一 次 ， 只 是 少 了 一 行 ， 却 比 代码 清单 7.7 整 整 少 了 20%， 并 且 我 们 也 不 再 需要 APIlClient 中 用 于 修补 的 setter 方 法 。 除 了 代 
码 更 加 精简 之 外 ， 明 确 地 通过 构造 函数 传递 依赖 ， 这 种 方式 更 加 自然 和 直接 地 将 我 们 的 对 象 与 其 协作 者 联结 在 一 起 。 朋 友 无 需 让 


朋友 做 静态 的 服务 查找 。 口 | 


译 者 注 





[1] 原文 是 Yak-shaving， 意 为 给 尾 牛 闲 毛 ， 指 短期 看 似 无 用 小 动作 ， 长 期 积累 却 能 解决 大 问题 。 
D2] 郑 牛 闲 须 的 定义 ， 参 见 http://en.wiktionaty.ofe/wiki/yak_shaving。 
[3] 《针对 Java 编程 语言 的 安全 编码 指南 ，4.0 版 >》 。 参 见 http://www.otacle.comy/tech- network/java/seccodeguide-139067.html。 


[4] 模板 方法 模式 ， 参 见 http://en.wikipedia.org/wiki/Template_method_pattern。 
译 者 注 





[5] 除了 常见 的 六 面 股 ， 还 有 其 他 面 数 的 乳 子 ， 如 四 面 股 、 十 二 面 服 等 ， 用 于 桌面 游戏 或 赌博 中 。 


[6] 履 盖 一 个 从 构造 阵 数 中 调用 的 方法 ， 这 是 件 棘 手 的 事情 ， 而 且 可 能 导致 意料 之 外 的 行为 。 参 见 《Java Language Specification》 
(http://mng.bz/YFFT) 中 的 细节 。 





D] 原文 这 里 用 singleton， 而 非 Singleton。 首 字母 大 小 写 的 不 同 ， 强 调 了 实例 是 否 唯一 的 区 别 。 译 者 注 

[8] 引 自 James Sugrue 的 博客 对 MigKo Hevery 的 采访 ，《 可 测 代码 的 好 处 》 (The Benefits of Testable Code) ，2009.11.17， 参 见 
http:/ /java.dzone.com/articles/benefits-testable-code。 

[9] 担心 你 的 构造 函数 已 经 包含 了 6 个 参数 ? 听 上 去 你 的 代码 可 能 缺失 了 一 两 个 抽象 一 一 这 就 是 仔细 观察 后 发 现 的 数据 泥 团 (data 


clump) 。 如 果 是 这 样 ， 或 许 引 入 一 个 参数 对 象 (http://www.refactotring.com/catalog/introduceParameterObject.html) 会 有 所 帮助 。 





7.4 小结 


本 章 开 始 时 ， 我 们 讨论 了 可 测 的 设计 ， 推 导出 模块 化 设计 ， 并 介绍 了 sOLID 设 计 原 则 ， 其 中 包括 单一 职责 原则 (SRP) 、 开 
闭 原则 (OCP) 、 里 氏 蔡 换 原 则 (LSP) 、 接 口 隔离 原则 (ISP) 和 依赖 倒置 原则 (DIP) 。 遵 循 这 些 原 则 可 市 来 更 加 模块 化 的 设 
计 ， 因 而 更 加 可 测 的 设计 。 


可 测 性 问题 可 以 归结 为 我 们 无 法 编写 测试 或 者 非常 太 烦 。 这 些 麻 烦 包括 : 
“无 法 实例 化 一 个 类 

“ 无 法 调用 茶 个 方法 

` 无 法 观察 方法 的 输出 或 副作用 

` 无 法 替换 成 测试 替身 

` 无 法 履 盖 茶 个 方法 


基于 从 这 些 问 题 中 学 到 的 以 及 过 往 经 验 ， 我 阐述 了 一 些 指南 ， 用 于 避免 上 述 可 测试 性 问题 ， 以 便 达 成 可 测 的 设计 。 那 些 指南 
教 给 你 避免 final、static 和 复杂 的 private 方 法 。 你 应 该 学 会 小 心地 对 待 hnew 关 键 字 ， 因 为 本 质 上 它 是 无 法 替换 挥 的 硬 编码 。 


你 应 当 避 免 在 构造 浮 数 中 放置 重要 的 钦 辑 ， 因 为 它们 难以 被 覆 匡 。 你 应 该 避免 用 传统 的 万 式 实现 单 例 模式 ， 而 是 及 用 只 创建 
一 次 的 万 式 。 你 了 解 到 组 合 优 于 继承 ， 因 为 组 合 比 继承 所 隐 合 的 类 继承 天 系 更 加 灵活 。 


我 们 注意 到 继承 和 直接 调用 外 部 库 的 危险 ， 因 为 这 些 库 在 你 的 控制 之 外 ， 比 起 你 目 己 的 代码 ， 它 们 通 弟 是 更 加 不 可 测 的 设 
计 。 最 后 ， 你 学 到 避免 服务 查找 ， 而 是 通过 构造 冰 数 参数 来 传 入 你 的 依赖 。 


尽管 它们 不 是 必须 遵守 的 规则 ， 但 时 刻 记得 这 些 指南 ， 并 在 违反 它们 之 前 考虑 一 下 ， 束 一 定 会 帮助 你 想 出 更 加 可 测 的 设计 。 


还 有 呢 ! 互联 网 上 到 处 都 是 关于 可 测 的 设计 的 有 用 信息 。 我 最 喜欢 的 大 概 是 Google Tech Talk 视 频 。 如 果 你 有 亲眼 时 间 ， 
去 youtube.com 搜 索 “The Clean Code Talks”。 那 有 好 多 有 用 的 东西 ! 


当 你 看 完 那 些 视频 ， 我 们 就 一 起 进行 男 一 个 话题 。 下 一 草 ， 你 将 看 到 如 何 使 用 其 他 JVM 语 言 来 为 你 的 Java 代 码 编写 测试 。 


第 8 章 ”用 其 他 JVM 语 言 来 编写 测试 


本 章 内 容 包括 : 
- 在 JVM 上 使 用 多 种 编程 语言 
. 用 动态 语言 实现 测试 的 简洁 性 
利用 行为 驱动 开发 框架 提高 表现 力 


编程 是 用 计算 机 可 理解 的 语言 来 表达 你 的 想法 和 意图 。 对 于 Java 程 序 员 来 说 就 是 编写 一 种 可 以 由 Java 编 译 器 编译 为 可 以 运行 
在 JVM 上 的 字 节 码 的 代码 。 不 目 一 种 编程 语言 可 以 编写 能 运行 企 JVM 上 的 代码 ， 不 过 每 种 JVM 语 言 都 具有 其 独特 的 语法 和 感 
况 ， 但 有 一 点 是 相同 的 : 关于 在 J 以 M 创 建 应 用 程序 这 件 事 上 ， 它 们 都 号 称 比 Java 更 加 简洁 和 更 具 表 达 力 。 


本 草 中 我 们 探索 这 些 现代 编程 语言 针对 编写 单元 测试 的 任务 方面 可 能 具有 的 优势 。 你 将 见证 用 如 Groovy 这 样 的 动态 语言 编 
写 测 试 的 方方面面 ， 然 后 尝试 一 些 测 试 框架 ， 它 们 吸收 了 动态 语言 的 强大 表达 力 和 指定 期 望 行为 的 BDD 风 格 ， 成 为 Java 和 和 JUnit 
上 书写 测试 的 重要 蔡 代 品 。 


正如 Dean Wampler 在 2009 年 说 过 ，“ 现 今 正 是 成 为 Java 程 序 员 的 激动 人 心 的 时 代 。” 


8.1 混合 使 用 JVM 语 言 的 前 提 
另类 JVM 语 言 的 历史 可 追溯 到 15 年 前 ， 那 时 Jim Hugunin 在 编写 ython， 即 一 种 JVM 上 的 Python 语言 实现 。 尽 管 )ython 难 
以 获得 发 展 的 动力 ， 且 实际 上 在 2005 年 停止 了 开发 ， 但 它 启发 了 后 来 许多 JVM 语 言 的 出 现 。 


就 在 Jython 项 目 宣 布 不 久 ， 其 他 语言 也 纷纷 登场 。JRuby， 一 种 用 Java 实 现 的 Ruby 编 程 语言 从 2001 年 开始 开 友 ， 而 James 
Strachan 在 2003 年 公布 了 Groovy， 成 为 JVM 上 编 瑟 脚本 的 重要 选项 。 同 样 在 2003 年 ，Martin Odersky 发 布 了 Scala 编 程 语 言 ， 
而 2007 年 Rich Hickey 的 Clojure 作 为 一 种 Lisp 方 言 (dialect) 加 入 了 JVM 语 言 大 苗 。 正 因 这 些 运 行 在 JVM 上 语言 ， 那 么 如 果 未 


来 10 年 被 命名 为 多 语言 编程 的 10 年 ， 我 一 点 都 不 会 惊讶 。 


每 种 语言 都 为 VM 提供 了 编写 程序 的 不 同方 式 。 有 着 精简 语法 的 Groovy 承 诺 与 Java 代 码 之 间 流 畅 的 互 操作 性 和 极 高 简洁 
性 ， 而 JRuby 更 为 激进 地 远离 Java 的 括号 式 语 法 。Scala 承 诺 在 面 同 对 象 编程 之 上 市 来 消 数 式 编 程 的 威力 ， 而 Clojure 提 供 了 继承 
于 Lisp 的 纯 尔 数 式 编程 。 


概括 来 说 ， 这 些 语言 的 一 些 潜在 优势 在 于 : 
` 更 少 的 样板 代码 语法 可 以 去 芜 存 黄 

- 更 多 的 文本 (literal) 数据 结构 

“ 针对 标准 类 型 的 额外 方法 

` 更 多 强大 的 语法 结构 


例如 ， 去 除 样板 代码 比如 不 必要 的 可 见 性 修饰 符 和 花 括号 ， 可 以 给 缩 进 留 下 更 多 空间 来 展示 代码 意图 。 来 看 看 如 何在 Ruby 


中 定义 一 个 类 : 


class Book 
def initialize(title = "Work in Progress") 
@title = title 
epages = [ | 
end 


def write page 
Qpages << page 
end 


def page_count 
Qpages.size 
end 
end 


一 个 从 括号 也 没有 ， 圆 括号 在 很 大 程度 上 也 是 可 选 的 ， 私 有 成 员 无 需 声明 ， 也 不 必 大 声 训 出 return。 你 不 免得 很 简洁 吗 ” 同 
样 ， 不 用 Java 泛 型 和 类 括号 约束 就 能 定义 数组 和 字典 (Map) 结构 ， 这 对 大 脑 以 及 你 的 手 甩 来 说 都 是 一 种 解脱 。 看 看 在 Ruby 中 
定义 复杂 的 、 多 维度 数据 结构 是 多 么 容易 : 
my_data = { 
:Key => 'value', 
a me I MA ET OME 
:map => { :inside => :the map } 





切换 语言 的 程序 员 最 常 抱 纺 的 说 法 之 一 ， 束 是 Java 缺 少 针对 基本 类 型 的 顺手 方法 下 子 融 想到 了 字符 串 操作 和 集合 操 
作 。 下 面 这 行 Scala 代 码 根 据 对 象 的 某 个 属性 将 对 和 象 列表 拆 分 成 2 个 ， 你 能 想象 要 用 多 少 行 Java 代 码 才 能 做 到 吗 ? 


val (minors, adults) = People partition (_.age < 18) 


另 一 个 我 喜欢 的 Scala 特 性 是 联合 case classes 和 pattern matching 的 力量 来 表示 重要 的 类 层次 关系， 如 此 一 来 ， 不 仅 可 以 
向 层次 天 系 内 添加 新 类 型 ， 而 且 可 以 添加 新 的 操作 。 你 需要 看 看 像 Joshua Suereth 的 《Scala in Depth》 (Manning 出 版 
社 ，2012) 之 类 的 书 才能 完全 理解 case classes， 不 过 代码 清单 8.1 可 以 让 你 先睹为快 。 


代码 清单 8.1 Scala 的 case classes 和 pattern matching 


abstract class Tree 


case class Branch(left: Tree, right: Tree) extends Tree 征 久 case 
case class Bunch (numberOfBananas: Int) extends Tree class 
def countBananas (七 : Tree): Int = 七 match { 
case Branch(left, right) => 数 枫 上 
countBananas (left) + countBananas (right) 合 焦 时 
Case Bunch (numberOfBananas) => numberOfBananas 方法 
} 
val myPlant = Branch 创建 有 2 个 分 又 的 


Branch (Bunch(1), Bunch(2)),, 
Branch (Bunch(3), Bunch(4)) ) 


println("I've got " + countBananas (myPlant) 
+ " bananas in my tree!") 


新 语言 、 新 语法 、 新 API 刚 开始 看 起 来 会 令 人 生 嫌 ,但 你 从 来 都 不 是 一 个 人 在 战斗 。 针 对 这 些 语言 已 经 存在 大 量 信息 和 文 
档 ， 既 有 在 线 的 也 有 纸 质 书 。 另 外 ， 在 这 些 新 编程 语言 周围 形成 的 社区 是 友好 和 充满 热情 的 ， 很 容易 融入 进去 。 





我 们 可 以 自由 支配 新 语言 结构 的 威力 。 闭 包 、 列 表 比 较 、 原 生 正 则 表达 式 、 字 符 串 插值 、 模 式 匹 配 、 隐 式 类 型 转换 一 不 
胜 枚 举 ， 这 些 语 言 特性 迟早 会 派 上 用 场 。 

本 章 中 我 们 有 个 更 具体 的 兴趣 点 : 如 何 使 用 这 些 语 言 来 帮助 我 们 为 Java 代 码 编写 和 维护 测试 ?我 们 先 谈 谈 这 个 ， 然 后 再 进入 
实战 。 
8.1.2 ”编写 测试 

这 些 另类 JVM 语 言 的 语法 糖 和 表达 力 、 丰 富 的 API 以 及 强大 的 语法 结构 所 带 来 的 好 处 全 部 都 可 以 运用 在 编写 测试 上 。 许 多 公 


司 (包括 我 自己 的 ) 越 来 越 多 地 转 同 成 熟 语 言 例如 Scala 来 开 友 他 们 的 生产 系统 。 其 他 一 些 公 司 则 由 于 各 种 各 样 的 原因 ， 还 在 犹 
也 要 不 要 跳 上 征程 。 


可 读 性 高 于 纯粹 性 能 

不 用 动态 语言 如 Groovy 或 Ruby 编 写生 产 代码 的 一 个 更 常见 原因 是 性 能 。 表 达 力 和 简洁 语法 的 喜悦 有 时 是 靠 牺 牧 绝 对 性 能 才 
换 来 的 。 潜 在 的 性 能 损失 通常 对 于 测试 代码 来 说 是 无 所 谓 的 。 毕 竟 测 试 代码 的 第 一 优先 级 是 可 读 性 ， 而 这 正 是 动态 语言 的 强大 之 
处 。 只 要 性 能 损失 不 严重 ， 你 就 能 从 表达 力 和 语法 简单 性 中 受益 。[ 

以 测试 作为 “诱导 性 毒品 ” 

除了 更 适合 完成 工作 的 优点 ， 团 队 还 可 以 通过 从 自动 化 测试 上 开始 采用 新 语言 从 而 在 一 个 安全 的 环境 中 尝试 和 学 习 。 以 这 种 
诱导 性 毒品 的 方式 ， 程 序 员 有 时 间 去 学 习 语言 及 其 惯例 ， 而 不 用 担心 由 于 不 熟悉 新 技术 而 导致 未 知 的 生产 问题 。 

这 种 多 语言 的 方式 也 有 缺点 。 首 先 ， 在 开发 环境 中 混合 两 种 编程 语言 会 增加 构建 过 程 的 复杂 度 。 其 次 ， 如 果 你 用 Groovy 来 
编写 测试 ， 然 后 测试 驱动 出 Java 代 码 ， 就 很 难看 出 其 他 Java 代 码 (其余 的 生产 代码 ) 有 多 适合 调用 新 AP|。 

相 比 之 下 某 些 语言 更 适合 于 测试 

对 于 换个 语言 来 编写 测试 的 特殊 目的 ， 相 比 之 下 ， 我 可 以 说 某 些 语言 更 为 适合 编写 测试 。 这 么 说 是 因为 编程 语言 首先 是 设计 
用 来 编写 应 用 程序 或 系统 软件 的 。 这 是 更 高 级 的 语言 特性 和 结构 的 价值 所 在 。 


同时 ， 对 于 更 好 更 简洁 地 表达 直 来 直 去 的 测试 来 说 ， 这 些 语言 特性 可 能 是 微不足道 的 。 例 如 ， 你 几乎 不 会 想 在 测试 代码 中 引 
入 复杂 的 类 层次 关系 ， 那 么 Scala 的 case classes 就 用 不 上 了 。 你 在 编写 测试 时 也 不 太 需 要 无 副作用 (side-effect-free) 的 函数 
安全 性 ， 那 么 在 Java 项 目 中 引入 Clojure 及 其 消 数 式 编 程 沁 式 也 没什么 意义 。 


总 的 来 说 ， 最 适合 编写 测试 的 是 那些 提供 简洁 语法 和 通用 数据 结构 的 语言 ， 而 不 是 那些 将 复杂 计算 变 为 现实 的 语言 。 从 这 点 
来 讲 ， 最 有 可 能 入 选 的 会 是 Ruby 和 Groovy 一 一 前 者 具有 极 小 化 的 语法 ， 而 后 者 更 容易 令 Java 程 序 员 上 手 。 


权衡 哪个 另类 JVM 语 言 更 适合 为 Java 代 码 编写 测试 ， 最 好 的 办 法 就 是 杀身 体验 。 接 下 来 我 们 残 来 研究 你 应 该 选择 那 种 工具 
以 及 如 何 打造 你 的 代码 和 测试 。 


我 们 先 做 个 简单 的 比较 ， 用 Groovy 来 编写 JUnit 测 试 ， 然 后 进一步 探讨 其 他 测试 框架 。 


[1] 多 语言 编程 一 一 在 应 用 开发 中 结合 多 种 编程 语言 和 多 种 “模块 化 范式 ”。 
[2] 巧合 的 是 ，15 年 前 许多 C/C++ 程序 员 因 为 低下 的 性 能 而 看 不 起 Java。 而 今 ，JVM 却 以 其 即时 编译 (Just-In-Time) 和 运行 期 优 
化 打败 了 许多 原生 编译 器 。 


8.2 ”用 Groovy 来 编写 测试 


用 Groovy 编 写 单元 测试 的 前 提 是 用 显著 轻 量 的 语法 来 表达 有 意图。 尽管 Groovy 仍 与 Java 相 似 ， 但 由 于 它 将 许多 Java 语 法 变 成 


可 选 从 而 变 得 轻 量 . 
例如 ， 在 Groovy 中 分 号 、 括 号 和 return 关 键 字 都 变 成 可 选 的， 可 以 不 写 ， 如 代码 清单 8.2 所 示 。 
代码 清单 8.2 Groovy 的 语法 就 像 剥 了 皮 的 Java 


Vold logAndReturn(String message) { 
def logMessage = "S${new Date()} - S${message}'" 
println logMessage 
logMessage 


代码 清单 8.2 中 ，Groovy 采 用 一 些 方 式 减 少 了 程序 员 需 要 写 的 样板 代码 。 因 为 Groovy 的 可 见 性 修饰 符 缺 省 为 public， 你 可 以 
像 代码 清单 8.2 一 样 省 略 它 ， 除 非 你 要 特别 地 限制 访问 。 你 能 看 到 在 Groovy 中 可 以 不 声明 变量 类 型 ， 而 是 用 def 来 声明 变量 。 


我 们 经 党 会 从 其 他 字符 串 、 数 字 和 对 象 的 字符 串 表 示 来 组 妆 字 符 串 。Groovy 也 能 使 这 种 事情 变 得 更 整洁 。 你 可 以 看 到 代码 
清单 8.2 中 是 如 何 组 装 logMessage 的 。(1] 


这 些 只 是 Groovy 中 有 助 于 漂亮 语法 的 一 部 分 语言 特性 。 我 们 对 编写 测试 更 感 兴趣 ， 那 么 就 来 谈 谈 更 具体 的 测试 setup 任 务 
吧 ， 以 及 Groovy 如 何 提供 帮助 。 


8.2.1 简化 的 测试 setup 


单元 测试 setup 的 本 质 可 以 归结 为 创建 输入 对 象 的 图 谱 以 及 将 与 被 测 代 码 交 互 的 协作 者 。 比 起 Java，Groovy 使 复杂 对 象 的 创 
建 工作 变 得 容易 。 代 码 清单 8.3 展 示 了 最 终 的 setup 是 如 何 比 Java 版 本 更 简短 和 更 容易 阅读 的 。 


代码 清单 8.3 ”Groovy 在 创建 测试 对 象 时 大 放 光 芒 


class ClusterTest { 
def numberOfServers = 3 
def cluster 


QBefore 
Vold setUp() { 
cluster = new Cluster() 
numberOfServers.times { 这 是 循环 变量 
def name = "server-s{1it}" -© 


cluster.add new Server (name: name, maxConnections: 1) 


工 Ho EY 
了 用 讨 中 了 人 构 洁 
LN Ym WN = Cr 
一 \ 有 we 
| | 让 Mi 坊 人 rg 上 六 
六 一 :一 上 < 
上 女人 WP ] | 防潮 


wm we FI- 大寺 
} 可 但 


这 个 例子 展示 了 许多 特性 ， 显 示 了 Groovy 语 言 在 创建 复杂 对 象 方面 是 如 此 优秀 。 一 开始 是 个 循环 体 @， 在 其 中 创建 了 多 个 
较 小 对 象 作为 测试 夹具 。 芝 


Groovy 也 人 允许 你 通过 默认 构造 函数 全 传 递 变量 来 为 字段 赋值 。 例 如 ，Server 仅 有 一 个 默认 构造 函数 。 当 你 要 实例 化 


JavaBean 风 格 的 对 象 ， 而 它 又 需要 额外 的 setter 调 用 时 ， 这 个 特性 极其 好 用 。 
而 且 ， 通 过 定义 参数 ， 你 就 可 以 为 受到 getter 和 和 setter 方 法 困扰 的 接口 创建 假 实现 : 


class Person { String name } 


As 、\ 士 


上 还 代码 目 动 生成 了 getName0 和 setName (String name) ， 使 得 JavaBean 风 格 接口 的 实现 更 加 简洁 。 
个 仅仅 是 JavaBean 风 格 的 接口 。 一 般 来 员 ，Groovy 使 得 创建 接口 的 测试 蔡 身 变 得 容易 了 。 例 如 ， 下 面 一 行 代码 展示 了 如 何 
用 简单 的 代码 块 来 实现 java.lang.Runnable: 


def fakeRunnable = { println "RuUuNnning!" } as Runnable 


你 可 以 用 map 代 蔡 代码 块 来 实现 更 复杂 的 接口 : 


def reverse = | 
equals: false, 
compare: { Object[] args -> args[1] .compareTo(args [0]) } 
] as Comparator 
Collections.sort(list, reverse) 


在 这 段 代码 中 ，Comparator 对 稼 的 equals() 方 法 将 总 是 返回 false， 而 它 的 万 法 compare (a，b) 将 进行 反 向 的 目 然 排序 


(b.compareTo (a) ) 。 


除了 更 容易 地 定义 简单 类 ，Groovy 还 允许 在 同 个 源 文件 中 定义 多 个 顶层 类 。 这 有 助 于 保持 测试 蔡 身 崇 挨 着 它们 所 在 的 测 
试 ， 而 不 必用 几 个 内 联 类 将 测试 类 集中 起 来 。 


说 到 保持 内 容 在 同一 个 源 文件 中 ，Groovy 的 多 行 字符 捉 使 你 不 用 StringBuilders 束 可 以 覆盖 代码 清单 4.6 中 拙 务 的 setup 万 


class LogFileTransformerTest { 
String logFile; 


QBefore 
public void setUpBuildLogFile() { 
logFile = """[2005-05-23 21:20:33] LAUNCHED 


[2005-05-23 21:20:33] session-1id###SID 
[2005-05-23 21:20:33] user-1id###UID 
[2005-05-23 21:20:33] presentation-1id###PID 


[2005-05-23 21:20:35] Screenl 
[2005-05-23 21:20:36] screen2 
[2005-05-23 21:21:36]】] screen3 
[2005-05-23 21:21:36] screen4 
[2005-05-23 21:22:00] screen5 
[2005-05-23 21:22:48] STOPPED""" 

} 

// 


关于 Groovy 提 供 的 各 种 语法 糖 ， 参 考 “Groovy style and language guide” 可 获得 更 全 面 的 介绍 ， 参 见 
http://mng.bz/Rvfs, 


现在 ， 观 察 一 个 普通 的 JUnit 4 测试 在 Groovy 中 的 样子 ， 以 此 结束 我 们 的 Groovy 之 旅 。 


8.2.2 ”Groovy 式 的 JUnit 4 测试 
为 了 比较 ,我 们 用 Groovy 重 写 一 个 JUnit 4 测试 。 代 码 清单 8.4 展 示 了 用 普通 Java 编 写 的 单元 测试 类 。 
代码 清单 8.4 ”用 Java 编 写 JUnit 测 试 的 例子 


public class RegularJUnitTest { 
private ComplexityCalculator complexity = new ComplexityCalculator(); 


@Test 

public void complexityForSourceFile() { 
double samplel = complexity.of (new Source("Samplel .java")).; 
double sample2 = complexity.of (new Source("Sample2 .]java" ) ) ; 


assertThat (samplel, is(greaterThan(0.0))); 
assertThat (sample2, is(greaterThan(0.0))); 
assertTrue(samplel != sample2); 


从 简单 性 方面 来 说 ， 那 是 相当 典型 的 JUnit 测 试 。 代 码 清单 8.5 展 示 了 用 Groovy 重 写 同样 的 测试 。 
代码 清单 8.5 ”Groovy 从 测试 代码 中 移 除 了 语法 混乱 


class GroovyJUnitTest { 
默认 的 可 见 def complexity = new ComplexityCalculator() 






性 修饰 符 是 交 量 类 
publie ey | 型 是 隐 
VolLdQ complexityForSourceFile() { -in 
def samplel = complexity.of new Source("Samplel .java") 名 时 
def sample2 = complexity.of new Source("Sample2.jJava") 
圆 括号 是 assertThat samplel, is(greaterThan(0.0d)) 
可 选 的 assertThat sample2, is(greaterThan(0.0d)) 
assertTrue samplel != sample2 
} 


注意 源 代码 的 长 度 是 相同 的 。 尽 管 Groovy 提 供 了 大 量 的 语法 糖 ， 然 而 大 多 数 编写 展 好 的 JUnit 测 试 融 算 损 成 Groovy， 也 不 
会 变 得 更 短 。 但 圆 括号 和 分 号 将 会 大 大 减少 ， 并 且 越 复杂 的 测试 ，Groovy 市 来 的 收益 趣 多 。 


切换 到 足以 友 挥 Groovy 全 部 威力 的 测试 框架 ， 可 以 收获 更 多 的 简洁 性 。 


[1] 这 叫做 字符 串 插 值 (string interpolation) ， 是 动态 语言 的 常见 特性 。 


[2] 你 不 该 过 分 使 用 循环 ， 它 们 往往 会 向 测试 代码 中 引入 不 必要 的 复杂 度 。 


8.3 BDD 工 具 的 表达 力 
BDD 源 目 一 些 TDD 实 践 者 在 寻求 更 好 的 词汇 来 摘 述 在 TDD 循 环 中 测试 的 意图 。test 一 词 并 没有 抓 住 指定 期 所 行为 的 精 凤 ， 马 
反而 承载 了 太 多 的 含义 。 相 反 ， 社 区 开始 谈论 specification (需求 说 明 ， 简 称 specs) 和 行为 ， 而 非 测试 与 测试 方法 。 


作为 寻找 更 好 词汇 的 副作用 ，BDD 社 区 编写 了 大 量 好 用 的 蔡 代 品 来 创造 出 许多 类 似 JUnit 的 测试 框架 。 当 你 真正 指定 预期 行 
为 时 ， 这 些 工具 除了 帮助 你 避 开 测试 的 浑 水， 往往 还 能 强调 测试 意图 并 将 语法 淡 入 幕后 。 


我 们 看 看 如 果 你 改 用 这 些 工具 来 编写 测试 会 是 什么 样 的 。 


8.3.1 用 easyb 写 Groovy 需 求 癌 明 


评价 一 个 测试 框架 适用 性 的 一 个 关键 点 在 于 是 否 容 易 上 于 。 另 一 个 关键 点 是 描述 意图 与 表达 意图 所 需 语 法 之 间 的 信 品 比 。 测 
试 需要 的 语法 越 多 ， 它 束 越 友 不 透明 ， 也 束 难 以 浏览 样板 代码 并 找到 核心 内 容 。 


替代 性 JVM 语 言 如 Groovy、Ruby 和 Scala 都 以 简洁 语法 为 荣 ， 许 多 测试 框架 的 作者 都 利用 了 这 种 优势 。 其 中 一 个 easyb 框 架 
(http://easyb.org) 体现 了 BDD 框 架 中 流行 的 given-when-then 词 汇 。 代 码 清单 8.6 展 示 一 个 用 easyb 写 的 简单 需求 说 明 ， 其 
中 描述 了 在 两 个 不 同 场 景 (scenario) 中 对 列表 (list) 的 期 望 行为 。 


代码 清单 8.6 ”用 开源 easyb 框 架 描述 的 两 个 场景 


scenario "New lists are empty", { 
given "a new list" 
then "the list should be empty'" 
} 


scenario "Lists with things in them are not empty", 
gliven "a new list" 
when "an object is added" 
then "the list should not be empty'" 


注意 到 两 个 场景 读 起 来 好 像 都 和 自然 语言 差不多 。 这 些 场景 大 纲 (scenario outline) 清晰 地 沟通 了 意图 。easyb 令 人 愉快 
地 在 自由 (文本 字符 串 ) 与 结构 (given-when-then) 之 间 平 衡 。 


大 纲 不 能 帮助 计算 机 检查 需求 是 否 得 到 满足 。 你 需要 更 详细 地 摘 述 场景 ， 如 代码 清单 8.7 所 示 。 


代码 清单 8.7 ” 细 化 的 easyb 场 景 供 我 们 检查 需求 符合 度 


scenario "New lists are empty", { 
gliven "a new list", { 
1]ist = new List() 


} 
then "the list should be empty", 
list.isEmpty() .shouldBe true 
} 
} 
scenario "Lists with things in them are not empty", { 
gliven "a new list", { 
list = new List!() 
} 
when "an object is added", { 
list.add(new Object () ) 
} 
then "the list should not be empty", { 
list.isEmpty() .shouldBe false 
} 


浏 遇 代 码 清单 8.7 中 细 化 场景 的 given-when-then 步 骤 ， 你 会 看 到 每 个 步骤 的 舍 义 是 用 通俗 英语 朱 述 的 ， 而 每 个 步骤 要 传达 
的 技术 细节 是 用 代码 来 执行 的 。 


当面 对 高 度 专 业 的 领域 和 不 透明 的 API 时 这 非常 有 用 。 如 果 你 工作 的 代码 已 经 具有 良好 的 APl， 并 且 在 你 手中 和 脑子 里 都 同 
样 流畅 时 ， 你 反而 会 觉得 有 点 见 余 。 通 常 ， 你 要 问 easyb 是 否 适合 某 个 具体 项 目的 话 ， 那 么 答案 是 “看 情况 ”。 


easyb 不 是 唯一 的 BDD 风 格 工 具 。Spock Framework (www.spockframework.org) 提供 了 与 easyb 类 似 的 特性 。 它 有 几 
个 特殊 的 特性 值得 一 提 ， 让 我 们 仔细 看 一 看 。 


8.3.2 ” Spock Framework: 编写 更 具 表 达 力 测试 的 激素 


一 眼 望 去 ， 用 开源 Spock Framework 编 写 的 测试 (需求 说 明 ) 与 刚才 的 easyb 场 景 没什么 区 别 。 为 了 展示 相似 性 ， 代 码 清 
单 8.8 包 合 了 对 代码 清单 8.7 中 同一 个 List 对 和 象 的 需求 襄 明 。 


代码 清单 8.8 ”Spock Framework 的 语法 像 easyb 一 样 简洁 


LIIDOTZL 上 SDOCK .anmc 。 关 


class ListSpec extends Specification { 
def setup() { 


list = new List!() 
} 
def "is initially empty"() { 
expect: + ©@ 断言 
Inet Taty ty) ee Tele 
} 


def "is no longer empty when objects are added"() { 
when : -+ © 币 | 激 
list.add(new Object ( ) ) 
then: < 和 听 误 


list.isEmpty() == false 


例如 ，Spock Framework 的 方式 比 easyb 更 加 声明 化 (declarative) 。 框 架 行为 的 核心 是 块 (block) 的 概念 及 其 执行 ， 它 
是 特性 方法 (feature method) 生命 周期 的 一 部 分 。 代 码 清单 8.8 用 到 了 Spock 的 6 种 块 结构 中 的 3 种 。 


when 块 @ 的 内 容 可 以 是 任意 代码 ， 执 行 它们 以 触发 被 测 代 码 。 而 expect@ 或 then@ 块 中 的 语句 是 作为 断言 并 且 期 望 结 果 为 
true。 由 这 使 得 大 多 数 情 况 下 不 太 需 要 单独 的 断言 API 了 ， 尽 管 你 仍然 可 能 会 在 你 的 项 目 里 将 某 些 更 详细 的 语句 抽取 为 自 定义 断 
言 AP|。 


你 在 代码 清单 8.8 中 还 没 见 到 的 其 他 块 结构 包括 setup (及 其 别名 given) 、cleanup 和 where。 


setup (given) 最 瘦 被 省 略 挥 ， 在 特性 方法 中 ， 第 一 个 块 之 前 的 任何 代码 将 被 隐 式 地 作为 setup。cleanup 块 被 用 来 释放 特 
性 方法 用 到 的 资源 ， 类 似 于 JUnit 中 @After 方 法 的 作用 。 


where 块 更 有 意思 ， 最 好 用 Spock Framework 中 的 一 个 例子 来 解释 。 “where 块 总 是 出 现在 特性 方法 的 最 后 ， 并 且 有 效 地 
参数 化 执行 。 代 码 清单 8.9 展 示 了 它 是 如 何 工作 的 。 


代码 清单 8.9” 带 有 where 块 的 数据 驱动 的 特性 方法 


def "computing the maximum of two numbers"() { 


expect: 

Math.max(la, b) == c 
where: 

| 二 | 3 

b << [1，9] 

区 机 | 


} 


寺 性 方法 其 实 束 将 变量 a、b、c 值 的 两 种 组 合 [5，1，5] 和 [3，9，9] 代 入 expect 块 进行 计算 。 


这 种 参数 化 测试 可 以 很 方便 地 一 次 性 表达 多 种 变化 。 如 果 参 数 化 变量 超过 一 定数 量 ， 它 们 也 会 成 为 负担 。 谨 愤 地 使 用 你 刚刚 
获得 的 超 能 力 。 


我 说 过 Spock Framework 有 几 个 特性 值得 一 提 。 目前 你 看 到 的 是 其 中 一 个 ， 而 Spock Framework 支 持 的 另 一 个 特性 是 能 
够 指定 测试 蔡 身 的 交互 。 


8.3.3 Spock Framework 的 测试 替身 也 打 了 激素 


Spock Framework 天 生 支 持 为 接口 和 非 final 类 来 创建 测试 替身 。 这 些 在 Spock 分 类 中 称 作 mock， 它 们 可 以 用 以 下 两 种 方 
式 之 一 来 创建 : 


def Screen = Mock(Screen ) -ee dvriiamio" stylie 
Keyboard keyboard = Mock\() // "static" style 
两 种 风格 都 是 有 效 的 一 一 在 后 一 种 情况 下 ，Mock 的 类 型 会 根据 变量 的 类 型 来 推断 。 





通 党 会 通过 在 特定 环境 下 调用 测试 替身 的 方法 来 对 它们 进行 配置 。Spock 将 它们 处 理 为 stub 还 是 mock 取 决 于 调用 的 方式 和 
上 下 文 。 例 如 ， 要 给 一 个 万 法 打桩 以 返回 特定 值 的 话 ， 你 可 以 这 样 : 


Keyboard.receive() >> "this is stubbed input" 


其 中 的 > > 操作 符 告 知 keyboard， 当 它 的 receive 方 法 被 调用 时 要 返回 硬 编码 的 字符 串 。 相 类 似 ， 要 伪造 异常 的 话 看 起 来 是 
这 样 的 : 


keyboard.receive() >> { throw new KeyboardDisconnectedException } 


为 了 检查 预期 交互 是 否 发 生 ，Mock 实 例会 在 then 块 中 被 调用 ， 并 指定 了 在 测试 期 间 期 望 它 被 调用 的 次 数 。 代 码 清单 8.10 展 
示 了 一 个 需求 说 明 的 例子 ， 其 中 的 特性 方法 使 用 了 Spock Framework 的 Mock 对 象 。 


代码 清单 8.10 ”Spcock Framework 的 Mock 对 象 是 直截了当 的 


ijmport SPoOCcK . 工 BmgG .* 


class NewsletterSpec extends Specification { 
def newsletter = new Newsletter!{) 
def frank = Mock(Subscriber) 
def fiona = Mock!(Subscriber) 
def issue = Mock (Issue) 


def "delivers am issue to all subscribers"(}) 1 
given: "Fiona and Frank each have subscribed" 
newsletter. subscribe (frank) 


newsletter.subscribe (fiona,) Fiona 订阅 了 1 份 ， 
0 而 Frank 订阅 了 2 份 

and: "Frank has a duplicate subscript1on 

newsletter.subscribe (frank,) < 

when.: 


Fiona 应 该 收 到 1 份 
newsletter.sendl(issue) 上 


then: "Frank receives two copies of the issue" 
1 * fiona.receive (issue) < 
2 * frank.receive (issue) 


指定 预期 的 交互 


Spock Framewo 代 不 仅 支持 基本 的 “ntimes 基数 来 指定 预期 的 交互 数量 。 它 还 可 以 这 样 写 : 
(3.。 ) * frank.recelive(lssue) // 至 少 3 次 

或 
(_..3) * frank.receive(issue) // 最 多 3 次 


而 且 ， 你 还 可 以 这 样 写 ， 表 示 你 对 调用 时 所 带 的 参数 不 感 兴 


售 


2 * frank.receive(_) // 任何 参数 都 可 以 
这 些 只 是 Spock Framewotk 中 测试 替身 支持 的 一 些 常 见 特 性 。 完 整 内 容 参 见 www.spockftamewotk.com 上 的 官方 文档 。 
在 代码 清单 8.10 中 ， 需 求 襄 明 类 创建 了 一 个 夹具 ， 包 含 了 1 个 Newsletter、2 个 Subscribers 和 1 个 要 友 给 订阅 者 的 lssue。 


尽管 Fiona 只 订阅 了 一 份 报 纸 ， 但 Frank 订 阅 了 两 份 Q@。 因 此 ，Fiona 应 该 精确 地 收 到 一 份 报纸 @， 而 Frank 应 该 收 到 两 份 人 


这 种 指定 预期 交互 数量 的 方式 既 明 确 叉 直观。 再 次 ， 没 有 提 到 “断言 ”任何 事物 一 一 我 们 只 是 简单 地 说 出 所 期 望 友 生 的 而 
已 。 总 之 ， 即 使 是 本 章 中 短小 的 测试 代码 例子 ， 也 能 体现 出 动态 JVM 语 言 如 Groovy 来 编写 测试 的 强大 之 处 。 如 果 现 在 对 Java 程 
序 员 来 说 是 一 个 激动 人 心 的 上 时代， 那么 对 测试 感染 的 Java 程 序 员 来 说， 这 是 一 个 更 有 趣 的 时 代 。 


[1] 非 布 尔 值 会 根据 Groovy 的 真 值 表 来 计算 。 


[2] SpockBasics, Anatomy of a Spock specification》 ,参见 http://code.google.com/p/spock/wiki/SpockBasics。 


8.4 小 结 


本 章 一 开始 ， 针 对 使 用 替代 性 JVM 语 言 比 如 Groovy、Ruby 和 Scala， 我 们 先 回顾 了 一 些 推荐 的 好 处 。 


倾向 于 更 少 的 样本 代码 语法 和 更 强大 的 语言 结构 ， 从 而 在 整体 上 市 来 更 可 读 的 代码 。 无 论 是 为 了 在 安全 环境 中 来 学 习 新 语 
， 或 是 为 了 获得 这 毕 语 言 的 优势 ， 采 用 动态 语言 都 可 以 对 测试 进行 许多 改进 。 


ll 


本 章 的 例子 主要 围绕 Groovy， 一 种 更 加 广泛 的 另类 JVM 语 言 。Groovy 设 法 用 糖衣 炮弹 击 中 许多 程序 员 ， 它 接近 Java 却 又 提 
供 了 更 简单 的 语法 、 极 其 强大 的 威力 和 语言 灵活 性 。 


它 可 以 归结 为 一 些 细节 ， 比 如 可 选 的 分 号 和 括号 ， 能 够 到 处 省 略 关键 字 ， 选 择 从 上 下 文 来 推断 某 个 变量 的 类 型 ， 并 选 定 
public 为 默认 的 可 见 性 修饰 符 。 这 些 细节 累积 起 来 就 能 更 加 容易 地 编写 简洁 和 清晰 的 测试 。 


你 可 以 利用 动态 语言 如 Groovy 的 语法 糖 ， 而 继续 用 良好 却 古 老 的 JUnit 来 编写 测试 。 你 也 可 以 吃 下 红色 药片 ， 看 看 兔子 洞 到 
底 有 多 深 。 最 近 开 源 的 BDD 框 架 例如 easyb 和 Spock Framework， 在 表达 代码 的 预期 行为 时 ， 从 传统 的 JUnit 风 格 向 前 迈 出 了 更 
大 的 一 步 。 很 多 时 候 ， 这 一 步 是 朝 着 更 好 的 方向 。 


无 论 是 否 末 纳 一 种 不 同 的 语言 和 新 框架 来 测试 你 的 Java 代 码 ， 你 都 应 该 根据 你 的 情况 认真 考虑 。 也 束 是 说 ， 显 车 整洁 的 代码 
是 富 无 疑问 的 ， 但 主要 的 决策 因素 却 是 参与 的 人 。 技 术 是 固定 存在 的 。 


第 9 和 章 ”加 速 执行 测试 


本 章 内 容 包括 : 
` 找到 构建 缓慢 的 原 
` 如 何 使 测试 代码 运行 得 更 快 
: 如 何 使 自动 化 构建 运行 得 更 快 


到 目前 为 止 ， 你 应 该 明 折 了 为 什么 要 书写 目 动 化 测试 ， 以 及 如 何 能 (或 不 能 ) 使 测试 变 得 优秀 。 优 秀 测试 的 一 个 特征 就 是 快 
速 运 行 。 然 而 ， 当 你 累积 了 越 来 越 多 的 测试 套件 ， 你 的 有 反馈 环 也 在 扩大 。 本 章 阐 述 一 些 加 速 测试 执行 的 策略 一 一 运行 所 有 测试 
的 时 间 一 一 这 样 你 丈 能 及 时 得 到 宝贵 的 反馈 。 


首先 ,我们 先 探究 为 何 需要 更 快 地 执行 测试 和 构建 。 然 后 ， 我 们 对 缓慢 的 构建 (build) 给 出 一 个 忌 体 策 略 。 忆 体 策 略 分 为 
两 部 分 ， 本 章 内 容 主 要 关注 于 两 个 任务 : 


.加速 测试 
. 加 速 构建 


加 速 测试 意味 着 深入 代码 ， 找 机 会 使 测试 运行 得 更 快 。 我 们 不 仪 将 观察 源 于 测试 类 层次 关系 的 缓慢 ， 而 且 将 仔细 观察 在 测试 
中 所 执行 的 代码 ， 同 时 还 将 特别 关注 任何 访问 网 络 、 数 据 库 和 普通 文件 系统 的 地 方 。 


针对 加 速 构 建 ， 我 们 不 太 关 注 测 试 代码 的 细节 ， 而 是 观察 构建 脚本 是 如 何 执行 测试 的 。 我 们 追求 更 短 的 构建 循环 ， 关 注 用 更 
高 性 能 的 计算 机 (或 更 多 计算 机 ) 来 提高 性 能 ， 可 以 考虑 在 本 地 和 云端 平行 运行 测试 的 好 处 。 


你 有 各 种 选择 来 优化 测试 的 速度 。 你 可 以 加 速 测试 代码 ， 或 者 改变 运行 代码 的 方式 来 使 之 变 快 。 在 那 之 前 ， 咀 们 先 说 说 为 何 


要 把 追求 速度 放 在 首位 。 


程序 员 热 衷 于 让 目 己 的 代码 运行 得 尽量 快 。 几 十 年 来 ， 事 情 友 生 了 一 些 变化 ， 但 我 们 内 心 仍然 渴望 代码 运行 得 能 更 快 一 点 。 
在 过 去 ， 理 由 很 明显 : 硬件 对 代码 运行 有 着 严格 的 需求 和 约束 ， 包 括 内 存 和 寄存 器 的 可 用 容量 ,或 处 理 器 指令 执行 周期 。 


今天 ， 我 们 不 再 像 过 去 那样 受 限 ， 但 最 终 还 得 等 待 计算 机 完成 工作 。 局 动 一 次 构建 ， 然 后 我 们 半 倚 背 叹 气 ，“ 和 要 是 我 有 个 更 
快 的 计算 机 多 好 ”。 随 痢 测 试 通过 ， 屏 幕 上 一 个 接 一 个 地 打出 圆 点 ， 我 们 慢 慢 地 又 在 思 率 是 人 否 该 买 个 更 快 的 CPU 还 是 更 多 核 的 
CPU。“ 或 计 访 换 硬 盘 ? 硬盘 太 老 了 。 它 也 开始 友 出 噪声 了 。" 


这 就 是 问题 所 在 : 我 们 的 思维 比 测试 运行 得 还 快 ， 这 种 差异 市 来 了 冲突 。 


9.1.1 ”对 速度 的 需要 


我 们 对 速度 的 需要 来 自 于 我 们 伦 了 太 多 时 间 来 运行 测试 套件 ， 我 们 面 对 两 难 的 选择 。 要 么 有 盯 崇 屏幕 直到 跟 不 上 为 止 ， 要 人 么 启 
动 构建 后 束 去 干 点 别 的 。 前 者 扎 杀 了 我 们 的 热情 ， 而 后 者 使 我 们 错过 了 宝贵 的 快速 反馈 ， 不 能 尽早 友 现 问题 。 


测试 快速 运行 的 重要 性 在 于 延迟 反馈 会 造成 厅 烦 。 从 小 处 说 ， 开 友 者 必须 等 待 信息 一 一 验证 他 们 的 工作 一 一 并 停 下 任务 。 


往 大 处 说 ， 我 们 的 构建 时 间 如 此 之 长 ， 开 友人 员 在 提交 代码 之 前 只 能 运行 一 部 分 测试 ， 他 们 继续 其 他 工作 ， 把 完整 的 测试 贸 
给 构建 服务 器 来 执行 。 当 完整 测试 执行 完毕 但 有 些 地 万 出 错时 ， 开 友人 员 需 要 骨 次 切换 任务 ， 失 去 了 专注 从 而 降低 了 生产 力 。 


那么 我 想 要 更 快 的 反馈 ,但 如 何 才 能 得 到 呢 ? 开 友 者 应 该 如 何 对 待 他 们 的 测试 和 构建 来 缩短 反馈 环 路 呢 ? 


9.1.2 ”进入 状况 


当 程序 员 面 对 性 能 问题 时 该 怎么 办 ? 他 们 掏 出 分 析 器 (profiler) 来 识别 热点 并 找 出 如 此 性 能 的 原因 。 他 们 修改 代码 ， 然 后 
再 次 分 析 系 统 ， 看 看 这 次 修改 是 否 真 的 改善 了 性 能 。 


缓慢 的 测试 和 构建 应 该 用 同样 的 方式 来 应 对 : 避免 猜测 问题 的 所 在 ， 相反， 通过 分 析 测 试 执行 情况 来 收集 关于 现状 的 数据 。 
一 旦 你 找到 关键 热点 ， 融 抽出 工具 箱 开始 工作 。 


当 你 使 用 你 信任 的 螺丝 刀 和 和 鱼子 来 更 好 地 打造 构建 时 ， 记 住 要 频繁 地 运行 构建 来 检查 是 否 取得 了 你 希望 见 到 的 进展 。 


现在 ， 咀 们 谈 谈 如 何 分 析 你 的 测试 并 找 出 热点 。 


9.1.3 ”对 构建 进行 性 能 分 析 


种 粗略 的 性 能 分 析 ， 来 了 解 哪里 最 消耗 时 间 。 
现在 看 一 些 具体 的 做 法 。 首 先 ， 我们 假设 及 用 Apache Ant 作 为 构建 工具 ， 看 看 你 要 如 何 做 。 


分 析 一 个 Ant 构 建 


如 果 你 的 目 动 化 构建 采用 了 Apache Ant， 那 残 很 容易 得 到 每 个 目标 (target) 花费 时 间 的 基本 数据 : 


ant -logger org.apache.tools.ant.listener.ProfileLogger test 


Ant 市 有 一 个 内 置 的 日 志 记 录 器 (logger) ， 可 以 以 毫秒 为 单位 记 下 任务 和 目标 持续 的 时 间 。 我 曾 在 一 个 相当 大 的 开源 项 目 
上 运行 ProfileLogger。 我 对 正常 的 输出 进行 过 滤 ， 留 下 天 于 构建 目标 的 分 析 信 息 ， 代 码 清单 9.1 中 是 报告 的 内 容 。 


代码 清单 9.1 Ant 内 置 的 ProfileLogger 报 告 了 目标 所 耗费 的 时 间 


Target init: started Mon Jan 02 00:54:38 EET 2012 

Target init: finished Mon Jan 02 00:54:38 EET 2012 (35ms) 

Target compile: started Mon Jan 02 00:54:38 EET 2012 

Target compile: finished Mon Jan 02 00:54:41 EET 2012 (2278ms) 
Target cobertura-init: started Mon Jan 02 00:54:41 EET 2012 
Target cobertura-init: finished Mon Jan 02 00:54:41 EET 2012 (62ms) 
Target compile-tests: started Mon Jan 02 00:54:41 EET 2012 

Target compile-tests: finished Mon Jan 02 00:54:41 EET 2012 (78ms) 
Target Jar: started Mon Jan 02 00:54:41 EET 2012 

Target JjJar: finished Mon Jan 02 00:54:41 EET 2012 (542ms) 

Target instrument: started Mon Jan 02 00:54:41 EET 2012 

Target instrument: finished Mon Jan 02 00:54:43 EET 2012 (2026ms ) 
Target test: started Mon Jan 02 00:54:43 EET 2012 

Target test: finished Mon Jan 02 01:00:55 EET 2012 (371673ms) 








Target coverage-report: started Mon Jan 02 01:00:55 EET 2012 救 理 覆 疼 
Target coverage-report: finished Mon Jan 02 01:01:22 EET 2012 (26883ms ) 率 报 告 


Target failure-check: started Mon Jan 02 01:01:22 EET 2012 
Target failure-check: finished Mon Jan 02 01:01:22 EET 2012 (3ms) 


查看 代码 清单 9.1 中 的 输出 ， 你 可 以 点 现 大 量 时 间 (370 秒 ) 人 花 在 了 运行 测 了 上， 而 第 二 位 的 27 秒 消耗 在 创建 覆 兰 率 报 告 
上 。 例 如 compile 和 instrument 目 标 ， 仅 化 2 秒 多 ， 其 他 的 更 少 。 在 这 个 项 目 中 ， 对 test 目 标 之 外 进行 的 任何 性 能 优化 都 不 会 对 
整体 构建 时 间 产 生 影响 。 这 就 是 你 需要 关注 的 。 


用 Ant-Contrib 来 整理 分 析 器 的 输出 


Ant 内 置 的 ProfileLogger 很 方便 ,但 是 它 的 输出 太 哆 唆 了 ， 需 要 花 一 些 额 外 工作 才能 裁剪 出 如 代码 清单 9.1 中 的 精华 信息 。 如 


果 你 发 现 自 己 不 断 地 在 做 这 种 事情 ， 你 就 该 求助 于 Ant-Contrib 开 源 库 (http://ant-contrib.sourceforge.net) 。 


Ant-Contrib 提 供 了 一 些 额外 的 Ant 任 务 和 监听 器 (listener) ， 包 括 <stopwatch/> 任 务 和 


net.sf.antconttib.petf.AntPerformanceListenet 监 听 器 。 它 们 都 针对 分 析 构 建 的 需求 提供 了 更 专注 和 容易 理解 的 输出 。 
分 析 Maven 构 建 


Maven 没 有 测量 构建 时 间 的 内 置 工具 。 如 此 说 来 ， 你 束 要 在 POM 文 件 中 添加 maven-build-utils 
extension (https://github.com/Ikoskela/maven-build-utils) 插件 来 度量 ， 让 它 来 帮 你 记 账 ， 如 代码 清单 9.2 所 示 。 


代码 清单 9.2 ”局 用 Maven 插 件 非 单 简单 


encoding="UTF-8"?> 
<project xmlns="http://maven.apache.org/POM/4.0.0"> 


< 了 Fl Vverslon="1 .0" 


<extensions> 
<extensilion> 
<artifactId>maven—bulild-utils</artifactId> 


<build> 
<OroupId>com.glithub.lkoskela</groupId> 
<Version>l1 .A4</version> 
</extenslion> 
</extenslions> 
2 加 
WE -人 
EL 站 


< ul]q> 
<maven-bulilld-utils.activationProfiles> 


<pDIroperties> 
</maven-bulilld-utils.activationProfiles> 


perfstats 
区 3 注册 配置 


</propertlies> 
Me 
<profile> 
<1d>perfstats</1d> 
</profile> 

</proflilles> 

ee 
简单 加 几 句 话 丈 激活 了 插件 ， 然 后 列 出 了 每 个 Maven 生 命 周 期 阶段 (phase) 和 目标 (goal) 的 执行 时 间 。 
代码 清单 9.2 中 ， 我 首先 做 的 是 注册 构建 插件 人 @@。 告 诉 Maven 初 始 化 插件 ， 并 在 构建 过 程 中 将 其 与 生命 周期 时 间 挂 钩 
(hook) 。 接 下 来 ， 需 要 利用 maven-build-utils.activationProfiles 属 性 来 识别 激活 的 配置 文件 (activation profile) @,， 从 
告诉 maven-build-utils 何 时 进行 分 析 (我 们 并 不 需要 一 直 分 析 ) 一 一 我 喜好 称 配 置 文件 为 perfstats。 最 后 ， 为 了 使 这 一 切 有 


意义 ， 我 们 在 POM 中 还 需要 一 个 叫 这 个 名 字 合 的 配置 文件 。 
我 们 在 一 个 开源 项 目 中 启用 了 该 插件 ， 使 用 -P 参 数 从 而 带 着 perfstats 配 置 文件 来 调用 Maven， 并 得 到 了 如 代码 清单 9.3 所 示 


的 输出 。 
代码 清单 9.3 ” 某 开源 项 目的 构建 配置 文件 输出 示例 


S mv package -P perfstats 


[INFO] ----- BUILD STEP DURATIONS -i 


[INFO] [lgenerate-sources 1 ,25 3 名 ] 
[INFO] modello-maven-plugin:]Jawva 1],l1ls 93% 
[INFOI] modello-maven-plugin:xpp3-reader 0,1s 4 多 
[ INFO] modello-maven-plugin:xpp3-writer 0 ,0s 也 马 
[INFO] [lgenerate-resources 3,0s 8 名 ] 
[INFO] maven-—-remote-resources-plugin:process 2,4s8 "79% 
[ INFO] buildnumber-maven-plugin:create 0,6s 20% 
[INFO] [process-resources 0,3s 0%S] 
[INFO] maven—-resources-plugin:resources 0,3s 100% 
[INFO] [compile 1 ,9s 5 ] 
[INFO] maven—-compller-plugin:complile 1,9s 100% 
[INFO] [process-classes 9,8s 26%] 
[INFO| animal-sniffer-maven-plugin: check TT,8s 79% 
[| INFO | Dlexus-component-metadata:generate-metadata ,Ds 20 
[IINFO|] [process-test-resources 0 ,4s 省】 
[ INFO| maven-resources-plugin:testResources 0 ,4s 100% 
[INFO] [test-compile 0,1s 0 千 ] 
[INEFO ] maven-compiler-plugin:testcCompile 0,1ls 100% 
[INFO] [process-test-classes 0,5s 1 千 ] 
[| INFO| Plexus-component-metadata:ogenerate-test-metadata 0,5s 100% 
[INFO] [test 19,0s 52 和 省 ] 
[INFO] maven-surefire-plugin:test 19,0s 100% 
[INFO|] [package 0 ,5s8 ] 告 | 
[INEFO ] maven-Jjar-plugin:]jJar 0,S5Ss 100% 


该 输出 中 包括 了 每 个 阶段 和 目标 的 绝对 时 长 ， 以 秒 为 单位 。 我 们 也 能 看 到 每 个 目标 对 所 在 阶段 的 贡献 的 百分比 ， 还 有 每 个 阶 
段 对 整个 构建 的 页 献 。 这 并 非 严 谨 的 科学 ， 但 是 足以 指出 大 量 时 间 消 耗 之 处 。 显 然 大 部 分 时 间 都 伦 在 运行 测试 上 (52%) ， 但 也 
有 一 大 部 分 花 在 process-classes 阶 段 (26%) ， 主 要 是 由 于 一 个 叫做 animal-sniffer-maven-plugin 的 插件 。 吕 


重要 的 是 ， 我 们 要 理解 哪些 改进 是 可 以 通过 调整 测试 来 获得 的 ， 它 们 又 如 何 兼 顾 大 局 。 昌 然 测试 通 剃 是 消耗 时 间 的 大 户 ， 但 
最 好 还 是 检查 一 下 ， 因 为 有 时 CPU 阻塞 是 由 其 他 事情 引起 的 。 


现在 中 们 转移 焦点 ， 通 过 收集 测试 的 执行 时 间 ， 你 已 经 看 到 了 潜在 的 改进 氮 。 
9.1.4 对 测试 进行 性 能 分 析 


一 旦 你 决定 要 优化 测试 ， 你 丈 需 要 指出 现 有 的 瓶 贷 。 再 说 一 次 ， 你 可 以 信任 Java 分 析 器 。 也 殊 是 说 ， 你 最 好 从 已 有 的 工具 和 
报告 中 得 到 整体 结果 。 如 果 你 用 尽 一 切 手段 仍然 没 能 找 出 时 间 是 在 哪里 消耗 的 ， 这 时 再 改 用 局 动 分 析 器 ， 但 不 要 过 早 开 始 。 你 可 
能 会 伦 上 几 个 小 时 用 分 析 器 来 缩小 热点 的 汉 围 ， 而 一 份 简单 的 测试 报告 残 能 立即 告诉 你 去 哪里 找 。 


有 DG Unit Test Results. ,两 | 





二 1 0 心 i100.00W 由. 心 本 总 


Note: /iures are anticlipated and checked for with assertions whlle errors are unanticipated. 





Packages 
Note: package statistics are not Tomputed ei they only sum up all of its testsuites numbers. 
Tests Errors Failures Time(ls) Timestamp Host 
19 0 0 0.144 2012-D01-021723:43:03 L352 
Pa 0 0 0.114 2012-01-02T23:43:03 L352 
il4 0 0 QD.224 012-01-02123:43:03 L352 
Ee 0 D0.088 2012-01-02T23:43:03 L352 
31 0 0 0.127 2012-01-02T23:43:04 L352 
1 0 0 0.013 2012-01-02T23:43:04 L352 
晤 0 0 D.014 2012-01-02T23:43:04 L352 
13 0 0 0.007 2012-01-02123:43:04 L352 
19 0 0 0.021 2012-01-02T23:43:04 L352 
1 0 站 0.110 2012-01-02T23:43:04 L352 
12 0 0 0.177 2012-01-02T23:43:04 L352 
Name Tests Emors Failures Time(s) TimeStamp Host 
1 0 0 v.080 2012-01-02123:43:03 L352 
1 0 0 0.006 2012-01-02T723:43:03 L352 
4 0 0 0.015 2012-01-02T23:43:03 L352 
本 0 0 0.016 2012-01-02T23:43:03 L352 
2 0 0 0.011 2012-01-02T23:43:03 L352 
3 0 0 0.006 2012-01-02T23:43:03 L352 





图 9.1 Ant 的 <junitreport/> 任 务 创建 了 漂亮 的 测试 报告 
说 说 你 应 该 怎样 浏览 测试 报告 。 图 9.1 显 示 了 一 份 用 Ant 内 置 的 <junitreport/> 任 务 生成 的 HTML 测 试 报 告 


在 生成 的 报告 中 ， 你 会 看 到 一 列 名 为 Time (s) ， 它 会 告诉 你 伦 了 多 少 秒 去 执行 某 个 包 或 类 中 的 测试 或 单独 一 个 测试 方法 。 
尽管 这 不 是 找 出 最 缓慢 测试 的 最 简便 的 方式 ， 但 信息 其 实 都 在 那里 了 。 





如 果 你 正巧 使 用 Maven， 别 担心 一 一 也 有 一 个 相同 的 报告 生成 器 。Maven 用 内 置 的 maven-surefire-plugin 来 生成 测试 报 
告 。 图 9.2 展 示 了 我 为 某 开源 项 目 生 成 的 Maven 测 试 报告 示例 |。 


和 口 Surefire Report 


+ | file:///Projects/maven-core/target/site/surefire-rer & MQ Google 





Phan List 


[Summary] [Package List] [Test Cases] 






Org. i maven.lifecycle 站 0 i100% 强 ,7 了 11 
org.apache.maven.project.canonleal 1 让 0 100% 0,068 
rg.3pache.maven,lifecycle .internal 19 0 0 0 100% 1,559 
org.apache.maven.execution 2 0 0 日 
org:apache.mavenrtinfointernal 过 0 日 i100 和 O094 
org.apache.maven.project 44 自 让 0 吕 100% F619 
org.apache.maven.project.artifact 2 吕 100% D121 
org.apache.maven.lifecycle.internal.stub C1 | 0 0 100% 0 
org.Bpeachemaven 上 4 自 0 昌 100% 0.667 
urg-apaeche.mawvenm:settings 二 昌 | 问 1D05 O208 
org.apache.maven.toolchain 2 0 0 i100% O0003 
org:apeachemavenrepository | | 0 日 0 O001 
org.apache.maven.plugin a7 0 0 口 100% 过 二 站 过 
org.apache.maven.contfiguration 3 [a 0 i100% 2495 


Note: package statisties are Mot computed recursively, they only sum up all of its testsuites numbers., 
























































一 DefaultlifecyclesTest 1 恬 100% 0,186 
Eh DefaulttSschedulesTest 1 0 100% 0,104 
Lh LfecycleExecutorSubModulesTest 1 0 100% 0,147 
Bh LifecycleExecutorTest 12 必 100% 是 1 
Lh MavenExecutionPlanTest 6 四 100% 0.003 





100% D011 





图 9.2 ”Maven 的 maven-surefitre-plugin 质 件 也 创建 了 漂亮 的 测试 报告 


Maven 的 测试 报告 和 Ant 的 一 样 ， 首 先 按 包 来 统计 ， 然 后 是 依次 分 解 ， 最 后 是 单个 的 测试 方法 。 再 说 一 次 ， 所 有 信息 都 在 
那 ， 你 只 需 扫描 整个 报告 ， 然 后 关注 Time (s) 那 列 ， 记 下 需要 仔细 观察 的 缓慢 测试 。 


这 些 报 告 虽 是 基本 工具 ， 但 对 于 探测 缓慢 测试 已 经 可 以 帮 上 大 忙 。 尽 过 你 想 类 道 时 间 都 去 哪 了 ， 但 你 并 不 想 伦 几 个 小 时 来 记 
录 每 个 测试 方法 的 持续 时 间 。 


依靠 一 个 持续 集成 服务 器 


寺 续集 成 (continuous integration) 是 这 样 一 种 实践 ， 整 个 团队 频繁 地 同步 所 有 变更 一 一 每 天 好 几 次 





几乎 是 和 持续 进行 。 一 


个 相关 的 技术 是 建立 一 个 持续 集成 服务 器 来 辅助 团队 确保 同步 的 工作 是 稳固 的 。 


持续 集成 服务 器 通常 会 监听 那些 提交 到 版 本 控制 的 变更 ， 然 后 观察 一 次 提交 ， 运 行 该 版 本 的 整个 构建 。 如 果 编 译 、 测 试 运行 
或 任何 构建 步骤 失败 了 了， 那么 服务 器 就 会 通知 开发 团队 ， 告 知 最 后 一 次 提交 出 问题 了 。 


持续 集成 服务 器 通 第 很 有 用 ， 它 能 确保 你 编写 的 代码 不 只 在 你 自己 的 机 器 上 工作 ， 而 且 也 能 在 其 他 人 的 机 器 上 运行 。 它 也 用 
来 减轻 缓慢 构建 的 问题 ， 这 样 开 发 者 在 开发 时 只 需要 运行 一 部 分 测试 就 可 以 了 。 每 当 开 发 者 提交 一 次 变更 到 版 本 控制 时 ， 持 续集 
成 服务 器 就 运行 完整 的 测试 集 ， 捕 获 任何 被 开发 者 选择 的 测试 子 集 源 挤 的 问题 。 


你 需要 考虑 这 种 做 法 ， 因 为 它 会 加 强 你 的 单元 测试 反馈 环 路 。 但 它 也 是 有 代价 的 。 相 比 一 直 运 行 完整 测试 套件 的 做 法 ， 如 果 


你 的 测试 子 集 没 能 发 现 某 个 问题 ， 那 就 会 很 晚 才 能 发 现 那个 问题 。 


你 的 加 速 工 具 箱 里 有 两 个 隅 辣 。 一 边 是 久 经 沙场 的 扩 巧 和 调整 测试 代码 的 检查 代码 清单 ; 另 一边 是 操纵 构建 脚本 以 获得 额外 
吸引 力 的 技巧 和 提示 


有 时 候 ， 最 货真价实 的 还 是 调 优 你 的 测试 代码 ， 但 有 时 则 并 非 是 代码 令 你 的 构建 陷入 困境 。 


忌 之 ， 可 以 在 两 个 不 同 的 地 方 来 改善 反馈 环 的 速度 : 代码 和 构建 。 本 章 接 下 来 束 分 为 两 部 分 ， 每 个 部 分 都 展示 用 于 加 速 测试 
运行 的 技巧 和 策略 。 我 们 将 以 代码 来 开场 ， 而 以 更 宏伟 的 基础 设施 建设 计划 来 收尾 。 


[1 男 一 个 常见 来 源 是 启动 外 部 进程 和 大 量 文件 操作 的 额外 开销 。 
[2] 插件 是 Maven 3 的 新 增 特性 。 
3] 我 也 不 知道 那个 插件 是 干什么 的 。 


9.2 令 测 试 代码 加 速 

加 速 的 本 质 是 寻找 缓慢 的 事物 ， 使 之 运行 得 更 快 或 者 根本 不 要 运行 。 这 并 不 是 说 你 应 该 找 出 最 慢 的 测试 然后 删 挥 它 。 虽 然 那 
也 可 能 是 一 步 好 棋 ， 但 或 许可 以 加 速 它 ， 这 样 你 束 能 在 回归 测试 的 安全 网 中 把 它 留 住 。 

下 面 几 节 中 ， 我 们 将 探讨 一 些 导致 测试 缓慢 的 单 见 原因 。 牢 记 这 个 简 赵 的 列表 可 以 让 你 迅速 找到 缓慢 乙 源 ， 从 而 避免 元 整地 


局 动 Java 分 析 器 所 市 来 的 麻烦 。 开 始 咯 ! 


9.2.1 ” 别 睡 宫 ， 除 非 你 肾 了 


看 似 有 点 儿 脑残 ， 但 如 果 你 希望 保持 测试 的 速度 ， 你 束 不 该 让 它们 的 睡觉 (sleep) 时 间 超 过 所 需 。 这 是 一 个 很 常见 的 间 
题 ， 所 以 即使 我 们 不 想 继续 深入 ， 我 也 要 明确 地 指出 来 。 沉 睡 蜗牛 的 问题 和 潜在 的 解决 方案 都 已 在 5.6 节 中 讨论 过 了 ， 所 以 这 里 
只 会 留 下 一 句 话 ， 其 他 的 丈 没 必要 重复 了 : 当 你 具有 同步 对 象 时 ， 不 要 依赖 于 Thread.sleep0， 那 样 才 会 更 可 靠 。 


好 了 ， 现 在 进入 更 有 趣 的 测试 速度 陷阱。 
9.2.2 ”当心 膨胀 的 基 类 


我 经 单 合 到 的 一 处 缓慢 乙 源 是 目 定 义 的 测试 基 类 。 


这 些 基 类 往往 包含 了 大 量 的 工具 方法 ， 以 及 公共 的 setup 和 teardown 行 为 。 所 有 这 些 代 码 对 于 开 友 者 编写 测试 来 说 很 方 


便 ， 但 也 市 来 了 潜在 的 成 本 。 


测试 很 可 能 并 不 需要 所 有 那些 为 了 方便 而 添加 的 行为 。 如 果 是 这 种 情况 ， 那 么 在 大 型 代码 库 中 你 融 要 小 心 了 ， 别 让 每 个 测试 
都 因为 录 段 代码 的 反复 运行 而 无 齐 地 分 摊 性 能 损失 。 


你 不 会 希望 测试 创建 了 永远 用 不 着 的 东西 ! 
结构 性 缓慢 


测试 类 的 层级 结构 以 及 setup 和 teardown 方 法 堆 者 拖延 了 执行 时 间 ， 其 原因 是 JUnit 以 层次 结构 的 方式 来 对 待 它们 。 当 JUnit 
要 执行 某 个 测试 类 中 的 测试 时 ， 它 首先 利用 反射 在 整个 继承 关系 树 中 寻找 带 有 @BeforeClass 注 解 的 方法 ， 追 溯 至 
java.lang.Object ( 它 显 然 不 会 有 任何 JUnit 注 解 ) 。 然 后 JUnit 从 父 类 开始 依次 执行 所 有 的 @BeforeClass 方 法 。 


在 每 个 QTest 广 法 之 前 ， 都 会 依照 @Before 注 解 做 同样 的 事情 ， 即 扫 摘 每 个 父 类 并 执行 所 有 找到 的 setup 方 法 。 在 测试 运行 
之 后 ， 惑 会 扫描 并 执行 所 有 的 @After 方 法 ， 而 且 一 旦 该 类 中 所 有 测试 执行 完毕 ， 还 会 扫 摘 和 运行 每 个 @AfterClass 注 解 。 


损 名 话说， 如果 你 从 其 他 类 继承 ， 不 论 你 是 否 需要 它们 ， 那 个 类 的 setup 和 teardown 都 会 与 你 上 自己 的 逻辑 一 起 运行 。 继 承 
天 系 越 深 ， 某 些 setup 王 teardown 的 执行 和 继承 树 的 所 历 瓯 越 有 可 能 浸 费 CPU 时 间 。 


示例 
我 们 来 考虑 图 9.3 中 的 场景 ， 现 在 你 有 一 套 基 类 ， 它 为 具体 的 测试 类 提供 了 各 种 工具 和 setup/teardown 行 为 。 


你 在 图 9.3 中 见 到 的 是 对 类 继承 的 滥用 。AbstractTestCase 类 提供 通用 的 自 定义 断言 ， 足 够 供 多 数 (即使 不 是 大 多 数 ) 的 测 
试 类 来 使 用 。 


MiddlewareTestCase 继 承 了 工具 方法 ， 用 来 查找 中 间 件 组 件 ， 例 如 Enterprise JavaBeans。 
DependencylnjectingTestCase 作 为 基 类 ， 服 务 于 任何 需要 与 依赖 进行 连接 (wire up) 的 测试 。 两 个 具体 的 测试 类 
TestPortalFacadeEJB 和 TestServiceLookupFactory 继 承 于 此 ， 于 是 握 有 了 所 有 的 工具 方法 。 


抽象 的 DatabaseTestCase 也 从 DependencylnjectingTestCase 继 承 而 来 ， 它 为 有 关 持 久 化 的 测试 提供 setup 和 
teardown， 用 于 操作 数据 库 。 图 9.3 显 示 了 两 个 继承 于 DatabaseTestCase 的 具体 测试 类 : TestCustomerEntity 和 
TestAccountEntity。 层 次 可 够 深 的 。 


<<abstract>> 为 测试 提供 带 见 的 
AbstractTestCase 目 定 闵 断 计 





<<abstract>> 捉 供 用 于 得 找 和 操作 中 间 件 
MiddlewareTestCase 组 件 的 工具 方法 
<<abstract>> 是 供 在 测试 中 进行 依赖 
DependencylnjectingTestCase 注入 的 工具 方法 





TestPortalFacadeEJB TestServiceLookupFactory <<abstract>> 





DatabaseTestCase 
s | 全 及 - 是 - A = J 二 上 利和 二 一 “下 全 用 一 一 
测试 某 些 中 间 件 层 对 依 徘 于 依 环 注 入 设施 的 为 了 对 持久 化 进行 测试 而 
组 件 内 容 进行 测试 设置 了 轻 量 级 数据 库 





TestCustomerEntity TestAccountEntity 
测试 “Customer ”实体 测试 “Account 实体 
及 其 持久 化 部 分 及 其 持久 化 部 分 


图 9.3 ”抽象 基 类 的 层级 关系 ， 为 具体 测试 类 提供 各 种 工具 方法 。 如 此 的 长 继承 链 常 常 导 致 不 必要 的 缓慢 


类 层级 天 系 本 质 上 没什么 问题 ， 但 过 深 的 层级 天 系 却 有 具体 的 痊 端 。 第 一 ， 重 构 层 级 关系 链 中 任何 事物 都 具有 巨大 的 潜在 影 
重 构 会 更 加 吃力 。 第 二 (主要 是 从 构建 速度 的 角度 ) ， 底 层 的 具体 类 不 太 可 能 都 需要 用 到 所 有 的 工具 万 法 。 





啊 


我 们 想象 一 下 ， 由 于 如 此 的 继承 链 ， 你 的 测试 平均 会 市 来 10 富 秒 的 不 必要 开销 。 在 一 个 包含 10000 个 单元 测试 的 代码 库 中 ， 
那 意味 着 一 分 半 钟 的 额外 等 竺 时间。 在 我 上 一 个 项 目 中 ， 那 个 数字 是 三 分 钟 。 哦 ， 你 一 天 运行 多 少 次 构建 呢 ? 芭 怕 每 天 不 止 一 次 
吧 。 


为 了 避免 浪费 ， 你 应 该 优先 使 用 组 合 而 非 继承 (和 生产 代码 一 样 ) ， 同 时 采用 Java 的 静态 导入 (static import) ， 还 有 
JUnit 的 @Rule 特 性 来 为 测试 提供 辅助 方法 和 setup/teardown 行 为 。 


总 而 言 之 ， 你 不 希望 测试 建立 永远 用 不 到 的 东西 。 你 也 不 想 怪 叔 叔 们 毁 了 你 的 刘 会 和 会 所 ， 而 这 会 把 我 们 市 到 下 一 个 缓慢 测 
试 的 常见 原因 。 


襄 到 setup.……… 


9.2.3 ”当心 多 余 的 setup 与 teardown 


天 于 JUnit， 你 学 到 的 第 一 件 事 束 是 如 何 将 测试 方法 的 公共 部 分 移 到 特定 的 setup 与 teardown 方 法 中 ， 用 @Before 和 
@After 注 解 标 记 起 来 。 这 是 极其 有 用 的 工具 ， 但 强大 的 能 力也 会 在 性 能 方面 残害 你 自己 。 


@Before 和 @After 方 法 中 的 代码 会 为 每 个 测试 运行 一 次 。 如 果 你 的 测试 类 有 12 个 测试 方法 ， 其 @Before 和 @After 方 法 会 





无 论 它 们 是 否 需要 每 次 都 运行 。 有 时 这 可 以 被 接 受 ， 但 有 时 那些 代码 要 伦 一 些 时 间 来 执行 ， 而 这 些 时 间 会 积 少 成 


当 你 有 一 个 测试 类 ， 而 且 其 中 的 setup 只 需要 运行 一 次 时 ， 那 么 通过 将 @Before 蔡 换 为 @BeforeClass 束 可 以 解决 问题 ， 简 
单 又 快乐 。 有 时 难以 看 出 这 种 见 余 ， 而 有 时 一 一 很 重要 一 一 你 小 小 的 修改 不 会 起 作用 的 ， 因 为 根本 没有 多余 。 


没有 什么 比 一 个 例子 更 适合 说 明 问 题 了 ， 接 下 来 看 看 代码 清单 9.4 中 展示 的 一 种 情况 ， 它 并 不 像 看 上 去 那么 直截了当 。 
代码 清单 9.4” 某 些 setup 和 和 teardown 可 以 不 用 那么 频繁 地 运行 
public class BritishCurrencyFormatTest { 


private Locale originalLocale; 


QBefore 

public void setLocaleForTests() { 
originalLocale = Locale.getDefault(); 
Locale.setDefault (Locale.UK); 


} 


@QAfter 
public void restoreOriginalLocale() { 
Locale.setDefault (originalLocale); 


} 


// actual test methods omitted 


Setup 获 取 区 域 设置 (locale) ， 并 妥善 保存 起 来 ， 然 后 设置 一 个 新 的 区 域 设置 用 于 测试 目的 。Teardown 则 恢复 原始 的 区 
域 设置 ， 这 样 ， 测 试 类 就 将 环境 还 原 到 原先 的 样子 。 

表面 上 看 ， 蔡 换 成 @BeforeClass 和 @AfterClass 根 本 不 费 脑 子 ， 接 下 来 就 可 以 赶快 庆祝 我 们 义 为 构建 时 间 节 省 了 1 个 毫 
秒 。[ 我 们 的 确 可 以 这 么 做 一 一 只 要 在 这 些 测试 方法 之 间 没 有 其 他 测试 会 运行 。 如 果 你 相信 没有 其 他 线程 会 改变 区 域 设置 ， 你 





就 可 以 信赖 @BeforeClass 和 @AfterClass。 





损 言 乙 ， 你 要 找 的 setup 方 法 应 当 是 那 种 在 一 遍 又 一 遍地 执行 不 变 的 、 无 副作用 的 操作 一 一 或 虽 有 副作用 但 没 人 在 意 的 操 


作 。 

我 的 一 位 技术 评审 者 Martin Skurla， 他 对 于 这 种 情况 提供 了 一 个 非常 好 的 例子 。 他 有 一 些 测试 和 一 个 @Before 方 法 ， 会 在 
项 目的 某 个 路 径 下 查找 源 文件 ， 并 将 它们 解析 成 对 象 图 供 测 试 使 用 。 因 为 所 有 这 些 都 在 @Before 万 法 中 完成 ， 相 同 的 源 文 件 丈 
会 被 解析 好 几 次 。Martin 注 意 到 了 这 个 问题 ， 他 马上 残 编 写 了 一 个 小 工具 类 ， 将 对 象 图 结果 缓存 下 来 ， 尽 量 跳 过 解析 行为 。 毕 
竟 ， 那 些 源 文件 在 测试 之 间 不 会 友 生 变化 。 

掌握 @Before 和 @After 简 直 束 像 是 无 价 之 宇 。 无 论 如 何 ， 如 果 你 的 构建 缓慢， 还 是 值得 检查 一 下 setup 与 teardown 消 耗 的 
时 间 一 一 这 样 它们 殊 会 被 更 加 合理 地 执行 。 


9.2.4 挑剔 地 添加 新 测试 


你 执行 的 代码 越 多 ， 所 花 时 间 束 越久 。 这 很 容易 推出 我 们 的 下 一 个 指导 方针 。 加 速 测试 的 一 个 潜在 方式 束 是 运行 更 少 的 测试 
代码 。 实 际 上 这 意味 着 在 被 测 代码 周围 紧密 地 画 一 条 线 ， 切 断 任 何 与 当前 测试 无 关 的 协作 者 。 


图 9.4 展 示 的 例子 涉及 了 3 个 类 及 相应 的 测试 。 特 别 要 注意 图 的 左上 角 : TransactionTest 和 Transaction。 





Transaction 
Test 


'alidator 
Test 










Transaction 


Processor i _ 
Test | 0 一 一 IE 一 


图 9.4 测试 隔离 减少 了 影响 结果 的 变量 的 数量 。 通 过 切断 相 邻 的 组 件 ， 你 的 测试 运行 得 也 更 快 了 


图 9.4 中 你 见 到 了 来 自 银 行 系统 的 3 个 类 。Transaction 类 负责 创建 要 送 交 处 理 的 交易 。Validator 类 负责 对 交易 执行 上 所 有 种 类 
的 检查 ， 确 保 它 是 合法 的 交易 。Processor 类 的 任务 是 处 理 交 易 并 将 其 友 送 到 其 他 系统 。 这 3 个 类 代表 了 生产 人 代码。 圆圈 之 外 则 


是 测试 类 。 


首先 关注 TransactionTest。 如 图 中 所 示 ，TransactionTest 操 作 Transaction 类 ， 并 且 切 断 了 它 的 两 个 协作 者 Validator 和 
Processor。 为 什么 ? 因为 如 果 将 那 几 个 验证 操作 短路 挥 ， 也 不 在 乎 Processor 是 如 何 处 理 的 ， 那 么 你 的 测试 会 运行 得 更 快 ， 而 
且 ， 对 这 两 个 组 件 特定 的 验证 和 处 理 操 作 并 不 是 TransactionTest 的 兴趣 所 在 。 


考虑 这 种 方式 : 你 想 要 在 TransactionTest 中 检查 的 行为 ， 只 不 过 是 新 创建 的 交易 会 被 验证 和 人 处理。 那些 行为 的 精确 细节 在 
这 里 并 不 重要 ， 于 是 你 可 以 安全 地 为 了 TransactionTest 而 将 它们 打桩 。 至 于 那些 细节 ， 将 会 在 ValidatorTest 和 和 ProcessorTest 


为 特定 测试 而 将 这 些 不 重要 的 部 分 打桩 ， 能 够 从 长 期 运行 的 构建 中 为 你 节约 宝贵 的 时 间 。 用 闪电 般 快 速 的 测试 替身 蔡 换 挥 计 
算 密 集 型 组 件 ， 由 于 执行 了 更 少 的 CPU 指令 ， 因 此 可 以 很 容易 地 加 速 你 的 测试 。 


有 时 ， 要 索 的 不 是 你 执行 的 指令 数量 而 是 捐 令 的 类 型 。 一 个 特别 单 见 的 例子 是 ， 某 个 协作 者 友 起 同 相 邻 系统 或 互联 网 的 远程 
调用 。 因 此 你 应 该 尝 试 尽量 保持 你 的 测试 在 本 地 运行 。 


9.2.5 ”保持 本 地 运行 ， 保 持 快速 


作为 基线 (baseline) ， 从 内 存 中 读 取 一 些 字 市 要 人 花 上 几 个 毫秒 。 比 起 访问 本 地 变量 或 调用 同 进 程 中 的 方法 ， 人 至 少 要 多 花 上 
十 万 倍 时 间 才 能 从 云 闯 的 Web 服 务 中 读 取 同样 的 字 节 。 这 融 是 你 为 什么 应 该 尽量 保持 本 地 运行 测试 的 关键， 避免 任何 缓慢 的 网 
络 调用 。 


假设 你 为 华尔街 的 交易 公司 开 上 有 友 了 一 个 交易 大 厅 程 序 。 你 的 程序 与 各 种 后 人 台 系 统 进行 集成 ， 而 且 为 了 举例 方便 ， 假 设 其 中 一 
个 集成 工作 是 要 调用 某 个 Web 服 务 来 查询 股票 信息 。 图 9.5 以 其 中 的 类 来 解释 这 个 场景 。 
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图 9.5 ”将 实际 的 网 络 调用 留 在 测试 之 外 ， 可 以 节省 很 多 时 间 


这 里 包括 被 测 类 StockTickerWidget， 它 调用 StockinfoService， 后 者 使 用 WebServiceClient 组 件 来 发 起 Web 服 务 调用 ， 
经 过 网 络 连 接 到 达 服 务 器 另 一 端的 StocklnfoService。 当 为 Stock-TickerWidget 编 写 测试 时 ， 


和 刀口 ] 四 


尔 只 是 对 它 与 StocklnfoService 
之 间 的 交互 感 兴趣 ， 却 不 在 平 StocklnfoService 和 Web 服 务 之 间 的 交互 。 


单 看 传输 的 开销 ， 第 一 段 是 1 毫秒 ， 第 二 段 也 是 一 样 ， 而 第 三 段 则 大 约会 是 100~ 300 毫 秒 。 切 断 第 三 段 将 减少 很 多 开销 。 
正如 在 第 3 章 中 讨论 的 ， 用 测试 蔡 身 蔡 换 掉 Stocklnfoservice 或 WebserviceClient 将 使 测试 更 加 独立 、 确 定 和 可 靠 


。 马 也 会 
允许 你 模拟 特殊 条 件 ， 例 如 网 络 瘫痪 或 Web 服 务 调 用 超时 。 


\ 一 /一 


从 本 草 的 角度 看 ， 不 论 是 调用 运行 在 Yahoo! 的 真实 Web 服 务 ， 还 是 运行 在 本 地 的 假 服 务 ， 最 重要 的 是 通过 避免 网 络 调用 
而 大 大 加 速 。 一 两 个 可 能 还 没什么 区 别 ， 但 如 果 它 成 为 常态 ， 你 束 会 开始 注意 到 |。 


回顾 一 下 ， 首 要 原则 是 避免 在 你 的 单元 测试 中 友 起 网 络 调用 。 更 具体 地 说 ， 你 不 应 该 看 到 你 的 被 测 代码 访问 网 络 ， 因 为 “ 呼 
叫 邻居 ”是 极其 缓慢 的 对 话 。 


一 个 特别 流行 的 邻居 是 数据 库 服务 器 ， 你 轧 是 调用 它 来 帮助 你 保存 事物 。 接 下 来 我 们 束 说 说 它 。 
9.2.6 ”抵御 访问 数据 库 的 诱惑 


如 前 所 述 ， 对 测试 执行 速度 来 说 ， 友 起 网 络 调用 是 非常 昂贵 的 。 这 只 是 问题 的 一 部 分 。 许 多 情况 下 ， 要 通过 网 络 调用 的 服务 
本 身 束 很 慢 。 很 多 时 候 ， 绥 慢 可 以 归结 到 幕后 进一步 的 网 络 调 用 或 对 文件 系统 的 访问 。 


如 果 你 的 基 绪 是 化 1 坚 秒 从 内 存 中 读 取 数 据 ， 那 么 从 打开 的 文件 句柄 中 读 取 同 样 的 数据 会 多 化 大 约 10 倍 时 间 。 如 果 我 们 再 把 


打开 和 关闭 文件 句柄 算 进 去 ， 那 残 比 访问 变量 要 多 化 1000 倍 ， 读 写 文 件 系统 慢 得 一 塌 糊 涂 。 


图 9.6 显 示 了 一 个 稍微 典型 的 setup， 其 中 的 被 测 类 CardController 使 用 数据 访问 对 象 (Data Access Object，DAO) 来 得 


询 和 更 新 实际 的 数据 库 。 
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图 9.6 ” 跳 过 实际 的 数据 库 调 用 ， 可 以 避免 不 必要 的 网 络 和 文件 系统 访问 


CardDAO 是 我 们 的 抽象 概 念 ， 用 于 持久 化 贷 记 卡 和 信用 卡 相关 实体 ， 以 及 和 找 已 经 持久 化 的 实体 。 其 育 后 实际 上 采用 了 
Java 持 久 化 API (JPA) 来 连接 数据 库 。 如 果 你 想 要 绕 过 数据 库 调用 ， 你 需要 用 测试 蔡 身 蔡 换 掉 背 后 的 EntityManager 或 
CardDAO 本 身 。 作 为 首要 原则 ， 你 应 该 更 加 严格 地 进行 隔离 。 


最 好 是 尽 可 能 地 靠近 被 测 代 码 来 隔离 协作 者 。 这 人 么 说 是 因为 ， 你 要 指定 的 行为 明确 地 是 被 测 代码 与 协作 者 之 间 的 交互 ， 而 个 
是 与 协作 者 进行 交互 。 而 且 ， 著 换 抒 直接 协作 者 的 话 ， 融 可 以 用 更 加 接近 于 被 测 代码 及 交互 的 语言 与 词汇 来 表达 测试 代码 。 


如 果 持久 化 在 系统 中 扮演 了 关键 角色 ， 你 必须 注意 利用 染 构 决策 来 维持 一 定 水 平 的 可 测 性 。 要 使 测试 感染 (test- 
infected) 的 生活 更 容易 一 些 的 话 ， 你 应 该 能 够 依靠 一 致 的 架构 而 在 单元 测试 中 整体 地 隔离 挥 持久 化 层 ， 用 更 少 的 集成 测试 来 测 
试 持久 化 设施 ， 例 如 对 象 天 系 映射 (Object-Relational Mapping，ORM) 框架 中 的 实体 映射 。 

忌 而 言 之 ， 你 要 最 小 化 对 数据 库 的 访问 ， 因 为 它 缓慢 ， 而 且 持 久 化 对 象 的 实际 属性 很 可 能 与 单元 测试 要 考察 的 逻辑 和 行为 无 
天 。 持 久 化 的 正确 性 是 绝对 要 检查 的 ， 但 你 可 以 在 别处 来 检查 一 一 很 可 能 是 作为 集成 测试 的 一 部 分 。 

轻 量 级 ， 随 手 可 用 的 数据 库 蔡 代 品 


除了 用 测试 替身 来 替换 掉 数 据 访问 对 象 ， 另 一 个 好 办 法 是 使 用 轻 量 级 的 数据 库 替 代 品 。 例 如 ， 如 果 你 的 持久 化 层 是 建立 在 
ORM 框 架 之 上 的 ， 而 你 不 需要 手写 SQL 语 句 ， 那 么 底层 的 数据 库 产 品 是 Oracle、MySQL 还 是 PostgreSQL 就 都 无 所 谓 了 。 


你 其 实 可 以 用 更 加 轻 量 的 产品 来 替代 内 存 中 和 进程 中 的 数据 库 ， 例 如 HyperfSQL (也 称 为 HSQLDB) 。 内 存 中 和 进程 中 数据 
库 的 主要 优点 在 于 ， 这 种 轻 量 级 的 替代 品 能 方便 地 避免 缓慢 的 持久 化 链 网 络 调 用 和 文件 访问 。 





我 拼命 地 再 提 一 下 呼叫 邻居 的 比喻 ， 朋 友 不 会 让 朋友 在 单元 测试 中 使 用 数据 库 。 
到 目前 为 止 ， 如 果 你 学 到 了 如 果 执 行 速度 是 一 个 因素 的 话 ， 那 么 单元 测试 应 该 远离 网 络 接口 和 文件 系统 。 文 件 MO 并 非 数 据 
库 所 独 有 的 ， 那 么 我 们 再 来 说 说 单元 测试 中 其 他 访问 文件 系统 的 现象 。 


9.2.7 没有 比 文件 /O 更 慢 的 /O 了 


尔 希 望 最 小 化 对 文件 系统 的 访问 ， 从 而 保持 测试 的 速度 。 这 包括 两 部 分 : 你 可 以 看 看 测试 本 身 在 做 什么 ， 你 还 可 以 看 看 涉及 
文件 I/O 的 被 测 代 码 在 做 什么 。 某 些 文 件 /O 是 天 键 功能 ， 而 某 些 束 是 不 必要 的 或 与 你 要 检查 的 行为 无 天 。 


避免 在 测试 代码 中 直接 访问 文件 


例如 ， 你 的 测试 代码 受到 逻辑 分 割 的 折磨 〈 见 4.6 节 ) ， 从 文件 中 读 取 一 堆 数据 ， 然 后 保 仓 人 在 项 目 目录 结构 中 的 某 个 地 方 。 
这 不 仅 从 可 读 性 和 可 维护 性 的 角度 造成 不 方便 ， 而 且 如 果 一 裔 又 一 遍地 读 取 和 解析 那些 资源 ， 它 真 的 会 抱 囚 测 试 的 性 能 。 


如 果 数 据 源 与 要 检查 的 行为 无 关 ， 你 应 该 考虑 找 个 办 法 ， 用 4.6 节 中 讨论 的 方式 来 避免 文件 MO。 至 少 你 应 该 考虑 只 读 取 那 些 
外 部 资源 一 次 ， 然 后 将 它们 缓存 起 来 ， 这 样 只 会 受到 一 次 对 性 能 的 冲击 。 


那么 如 果 文件 MO 在 被 测 代码 内 怎么 办 ? 
拦截 被 测 代码 中 的 文件 访问 


当 你 观察 生产 代码 时 ， 涉 及 读 写 文件 系统 的 最 冲 见 操作 融 是 写 日 志 。 这 种 很 好 办 ， 因 为 对 于 单元 测试 要 检查 的 业务 逻辑 或 行 
为 来 说 ,一 般 代 码 库 中 的 绝 大 多 数 日 志 并 非 其 核心 。 


写 日 志 功 能 也 很 容易 全 部 关闭 ， 这 是 我 最 喜欢 的 优化 构建 速度 的 技 15 之 一 。 


这 里 所 说 的 在 测试 期 间 关 闭 写 日 志 功 能 ， 到 底 能 市 来 多 少 改 进 ? 我 采用 正常 的 生产 日 志 设 置 来 运行 某 个 代码 库 中 的 测试 ， 单 
个 单元 测试 的 执行 时 间 在 100~300 毫 秒 。 将 日 志 级 别 置 为 OFF， 执 行 时 间 下 降 到 1~150 毫 秒 。 这 恰好 是 个 带 有 日 志 语 句 的 代码 
库 ， 于 是 影响 束 比 较 大 。 无 论 如何 ， 在 一 个 典型 的 Java Web 应 用 程序 中 ， 如 果 仪 仪 是 在 测试 执行 期 间 天 闭 日 志 的 话 ， 我 晕 不 恢 
讶 能 见 到 几 十 个 自分 点 的 改进 。 


由 于 这 是 我 最 喜欢 的 ， 那 么 响 们 不 妨 就 表 虽 唆 一 会 儿 ， 找 一 个 例子 看 看 它 是 怎么 做 的 。 
用 一 点 儿 class path 技 巧 来 关闭 日 志 


多 数 流 行 的 日 志 框 架 ， 包 括 标准 的 设施 ， 都 允许 通过 class path 中 配置 文件 来 进行 配置 。 例 如 ， 用 Maven 构 建 的 项 目 很 可 能 
将 其 日 志 配 置 保 存在 src/main/resources。 那 个 文件 看 起 来 是 这 样 的 : 


handlers = JjJava.util.logging.FileHandler 


# Set the default logging level for the root logger 
.level = WARN 


# Set the default logging level and format 
Java.util.logging.FileHandler.level = INFO 


# Set the default logging level for the project-specific logger 
com.project.level = INFO 


大 多 数 日 志 配 置 比 这 更 详尽 ， 但 它 显示 了 处 理 程序 (handler) 会 将 任何 info 或 更 高 级 别 的 消息 写 入 文件 中 ， 而 用 到 的 第 三 
万 库 也 会 记 下 任何 和 警告 (warning) 或 更 严重 的 消息 。 


多 亏 了 Maven 的 标准 目录 结构 ， 你 可 以 将 正常 的 日 志 配 置 替 换 为 只 用 于 自动 化 测试 的 配置 。 你 要 做 的 只 是 在 
src/test/resources 里 放 上 另 一 个 配置 文件 ， 因 为 在 class path 中 该 目录 的 内 容 被 放 在 了 src/main/resources 之 前 ， 因 此 新 配置 
文件 会 优先 被 取 走 。 

# Set logging levels to a minimum when running tests 

handlers = JjJava.util.logging.ConsoleHandler 


.level = OFF 
com.mycompany.level = ERROR 


除了 从 你 目 己 代码 中 报告 的 错误 (error) ， 这 个 最 小 日 志 配 置 的 例子 基本 上 会 关闭 所 有 日 志 。 你 可 以 选择 根据 喜好 来 调整 
日 志 级 别 ， 例 如 ， 人 允许 第 三 方 库 也 报告 错误 ,或 者 关闭 包括 你 目 己 代码 在 内 的 所 有 日 志 。 当 友 生 问题 时 ， 测 试 束 会 失败 ， 而 你 


是 想 看 看 出 了 什么 状况 ， 临 时 地 开局 日 志 并 重新 运行 失败 测试 也 相当 简单。 


我 们 注意 到 构建 缓慢 的 一 些 罪 魁 祸首 。 它 们 形成 了 一 份 检查 代码 清单 ， 如 果 你 担心 目 己 的 构建 太 慢 ， 可 以 看 看 这 份 代码 清 
单 。 如 果 你 的 反馈 环 路 变 得 太 长 ， 最 好 记 住 这 些 。 但 缓慢 不 是 由 于 测试 缓慢 呢 ? 如 果 你 无 法 通过 调整 测试 代码 来 改进 性 能 呢 ? 或 
许 是 时 候 瞧 瞧 你 的 基础 设施 了 ， 看 你 能 否 从 那里 来 加 速 。 


[1 说 实话 ， 如 果 我 们 只 是 在 谈论 1 个 毫秒 ， 我 们 大 可 不 必 费 力 去 优化 它 。 


9.3 ” 令 构建 加 速 


说 到 在 构建 和 测试 的 代码 之 外 来 优化 构建 速 戎 ， 大 问题 又 来 了 ， 到 底 哪 里 是 瓶 饥 ”基本 上 你 的 构建 要 么 是 受 限 于 CPU 要 么 
是 |/O。 那 意味 着 ， 如 果 你 的 CPU 已 经 日 热 化 运转 时 ， 那 么 将 你 的 旧 硬 盘 升 级 到 超 快 的 固态 硬盘 (SSD) 也 无 助 于 更 多 或 更 快 
(或 两 者 都 ) 地 构建 。 同 时 升级 |/O 和 CPU 性 能 才 更 有 可 能 起 作用 一 一 问题 是 起 多 大 的 作用 。 





后 续 章 刁 将 介绍 一 些 构建 设施 上 的 变化 ， 它 们 可 以 市 来 一 些 积极 影响 。 你 的 家 庭 作业 是 对 你 的 构建 进行 分 析 ， 友 现 其 中 哪 一 


部 分 会 在 特定 情况 下 带 来 最 大 的 影响 。!1] 


表 9.1 总 结 了 6 种 基本 万 式 ， 这 些 技术 在 本 章 后 面 有 所 摘 述 。 左 半边 显示 了 对 受 限 于 CPU 的 部 分 进行 加 速 ， 右 半边 显示 了 对 
限于 1/O 的 部 分 进行 优化 。 


表 9.1 对 受 限 于 CPU 或 I/O 的 构建 进行 加 速 的 方式 


受 限 于 CPU ? 受 限 于 1I/O ? 
使 用 更 快 的 CPU 使 用 更 快 的 磁盘 
使 用 更 多 的 CPU 核心 使 用 更 多 线程 
使 用 更 多 的 计算 机 使 用 更 多 磁盘 


N 


WN 


工夫 。 升 级 CPU 或 硬盘 总 会 给 你 市 来 更 好 的 整体 性 能 。 将 工作 


更 多 或 更 快 (或 者 两 者 兼 得 ) 。 听 上 去 简单 ， 其 实 要 伦 很 
个 线程 上 运行 测试 ， 有 助 于 保持 CPU 的 温度 ， 此 时 另 一 个 线程 


分 解 或 分 配 到 多 个 CPU 核心 上 通 弟 会 市 来 几乎 线性 的 提高 。 在 
正在 磁盘 上 等 街 。 


为 这 个 问题 而 抛 出 更 好 的 硬件 几乎 是 无 可 争议 的 ， 在 一 定 程度 上 来 说 真 的 有 效 。 但 你 能 买 到 的 CPU 或 硬盘 的 速 厦 忌 是 有 上 
限 的 。 从 那 时 起 你 需要 走向 更 加 复杂 的 极 冰 。 


本 草 接 下 来 会 探讨 这 些 解决 方案 ， 包括: 
` 使 用 更 快 的 磁盘 来 加 速 磁 副 操作 
并 行 在 更 多 的 CPU 和 线程 构建 
` 转 为 使 用 云 来 获得 更 快 的 CPU 
` 将 构建 分 布 到 多 台 计 算 机 上 


听 起 来 有 趣 吧 ? 我 希望 如 此 ， 因 为 我 很 兴 否 ! 现在 束 去 详细 地 说 明 如 何 实施 这 些 策略 。 


9.3.1 RAM 了 磁盘 带 来 更 快 的 |/O 


除了 购买 更 快 的 物理 硬盘 ， 一 个 获得 更 快 磁盘 的 潜 企 方式 是 将 你 的 文件 系统 挂 载 到 依赖 于 计算 机 RAM 内 体 的 虚拟 磁盘 
上 。 因 当 你 将 计算 机 的 一 部 分 物理 内 存 分 配 到 这 样 的 虚拟 磁盘 分 区 上 ， 你 可 以 像 平 常 一 样 读 写 文件 一 一 它 只 是 变 得 非常 快 ， 
为 它 读 写 内 存 比 转动 式 硬 盘 更 有 效率 。 

一 些 UNIX 家 族 的 系统 市 有 这 种 文件 系统 ， 叫 做 tmpfs， 立 即 融 可 用 ; 其 他 系统 你 也 能 很 容易 地 设置 类 似 的 内 存 “ 磁 盘 ”， 
供 构 建 来 使 用 。 


在 Linux 上 用 tmpfs 创 建 128MB 的 文件 系统 很 简单 ， 例 如 : D] 


Ss mkdir ./my _ ram disk 
Ss mount -t tmpfs -o size=128M,mode=777 tmpfs ./my_ram disk 


例如 ，tmpfs 文 件 系统 可 以 在 构建 脚本 的 开头 被 挂 载 ， 而 在 执行 所 有 测试 之 后 季 载 或 分 离 。 你 要 做 的 只 是 用 一 个 有 效 的 配置 
来 运行 测试 ， 将 所 有 文件 访问 都 指向 新 挂 载 的 文件 系统 上 的 文件 。 


为 了 在 Mac OS X 上 创建 相似 的 内 存 文 件 系统 (不 支持 tmpfs) ， 你 需要 在 挂 载 内 存 文件 系统 之 前 先 使 用 hdid 工 具 : 多 


RAMDISK= hdid -nomount ram://256000. 
newfs hfs SRAMDISK 
mkdir ./my_ram disk 
mount -t hfs SRAMDISK ./my_ram disk 


Ur Vr Ur Vi 


时 然 写 RAM 磁 盘 的 速 大 比 起 3SD 磁 盘 上 的 文件 系统 不 会 有 太 大 差别 ， 然 而 尽管 现代 操作 系统 都 是 通过 内 仔 映射 文件 来 提高 
磁盘 1/O 性 能 的 ， 但 它 与 纯粹 的 传统 转动 式 磁盘 还 是 有 巨大 郑 别 的 。 你 目 己 试 试 吧 ! 


如 果 RAM 磁 盘 不 能 给 你 市 来 足够 的 速度 提升 ， 别 担心 ， 我 们 的 袖子 里 还 有 几 个 戏法 儿 呢 。 比 如 ， 或 许 并 行 构建 能 降低 你 的 
构建 时 间 ? 


9.3.2 并行 构 建 


几乎 可 以 肯定 的 是 ， 无 论 你 的 构建 是 做 什么 的 ， 都 不 会 一 直 用 光 计 算 机 的 所 有 容量 。 这 是 个 好 消息 ， 因 为 它 意 味 着 通过 充分 
利用 现 有 容量 来 提升 性 能 的 可 能 性 。 


例如 ， 假 设 你 有 一 个 多 核 CPU。 (我 这 相当 低调 的 笔记 本 使 用 的 就 是 双核 处 理 器 ) 。 当 你 进行 构建 时 ， 你 会 同时 用 到 两 个 
核心 吗 ” 如 果 构 建 的 大 部 分 都 受 限于 CPU， 那 么 使 用 双核 CPU 来 蔡 代 单 核 可 以 降低 几乎 20% 的 构建 时 间 。 


如 果 构 建 不 是 完全 受 限 于 CPU ， 而 是 在 磁盘 /MO 上 化 了 大 量 时 间 ， 那 么 即使 只 有 单 核 的 情况 下 ， 并 行 化 仍然 有 意义 。 想 象 一 
下 构建 80% 的 时 间 是 CPU 在 处 理 数据 ， 而 剩 下 的 20% 时 间 里 硬盘 才 比 较 忙 。 你 的 机 会 在 于 那 20% 的 磁盘 |I/O 时 间 ， 更 具体 地 况 ， 
天 注 那 段 时 间 内 CPU 在 做 什么 (或 不 做 什么 ) 。 


在 单 核 情况 下 ， 同 时 在 几 个 续 程 中 运行 测试 并 不 会 真正 地 平行 化 执行 ，CPU 会 在 线程 之 间 来 回 切换 ， 而 不 是 同时 运行 它 
们 。 即 使 是 单 核 情 况 ， 只 有 当 一 个 线程 运行 代码 时 ， 另 一 个 线程 却 在 等 待 磁盘 MO， 这 样 企 多 个 续 程 上 运行 测试 才 有 意义 。 


咱们 看 看 如 何 让 你 信任 的 主力 实施 这 种 并 发 : Ant 和 Maven。 
用 Maven 做 并 行 测试 


襄 到 并 行 执行 测试 ，Maven 无 法 做 得 比 现在 更 好 了 。Maven 内 置 的 测试 运行 器 (test runner) 能 够 配置 为 在 指定 数量 的 线 
程 上 处 理 测 试 套件 。 你 要 做 的 只 是 按照 代码 清单 9.5， 在 POM 中 进行 一 点 配置 。 


代码 清单 9.5 告诉 Maven 的 Surefire 插 件 来 并 行 地 运行 测试 
<project> 
<build> 
<plugins> 
LucLr> 
<artifactId>maven-surefire-plugin</artifactId> 
<version>2.11</version> 
oonftdiratu ons 
<parallel>classes</parallel> 


threadCounts2e /threadCount> 
/oontiouration> 


< DLUGln> 
na 
</build> 

</project> 

代码 清单 9.5 中 的 配置 告诉 Maven 名 为 Surefire 的 内 置 测试 运行 器 局 动 两 个 线程 ， 每 个 CPU 核 心 上 一 个 ， 从 而 并 行 地 运行 单 
元 测试 。 也 可 以 通过 禁用 per-core 特 性 ， 从 而 措 定 精确 的 线程 数量 但 同时 无 视 CPU 核 心 的 数量 。 
<perCoreThreadCount>false</perCoreThreadCount> 

<parallel/> 属 性 接受 三 个 不 同 的 策略 来 向 工作 进程 分 配 测试 : 

:classes: 每 个 测试 类 会 在 不 同 的 线程 中 运行 

. methods: 来 自 同一 测试 类 的 每 个 测试 方法 都 在 不 同 的 线程 中 运行 

. both: 两 者 都 选 。 
三 个 选择 之 中 ， 最 容易 的 是 从 classes 开 始 ， 因 为 它 最 不 可 能 会 触及 测试 中 的 意外 依赖 。 尽 管 你 早晚 都 会 用 到 both.。 
除了 指定 用 到 的 线程 数量 ， 你 也 可 以 告诉 Surefire 使 用 尽 可 能 多 的 线程 数量 : 


<useUnlimitedThreads>true</useUnlimitedThreads> 


在 这 个 配置 下 ，Surefire 将 查看 <parallel/> 属 性 ， 并 基于 测试 类 或 测试 方法 的 思 数 来 启动 线程 。 不 管 这 快慢 与 否 ， 你 都 要 
目 己 斌 一 试 。 
TestNG 与 Maven 的 <parallel/> 配 置 


Sutefife 支 持 并 行 地 运行 TestNG 测 试 ， 但 不 如 JUnit 测 斌 容易 配 置 。 更 重要 的 是 ，petCoteThteadCount 和 useUnlimitedThreads 配 
置 不 起 作用 。 


现在 ， 如 果 你 没有 pom.xml， 但 只 有 一 个 build.xml 该 怎么 办 ? 
并 行 的 多 模块 Maven 构 建 


Maven 3 发 布 带 来 了 很 有 前 途 的 实验 性 功能 : -本 命令 行 参数 ， 用 于 将 整个 构建 并 行 化 。 比 如 ， 用 mvn-T 4clean install 命 令 来 运 
行 Maven， 会 分 析 构 建 的 依赖 并 尝试 在 四 个 线程 中 并 行 地 执行 。 


如 果 你 想 更 加 灵活 ， 并 根据 CPU 核心 的 数量 尽量 多 地 使 用 线程 ， 那 么 你 可 以 执行 mvn-T 1C clean install 命 令 ， 于 是 在 四 核 计 算 


机 上 你 会 得 到 四 个 线程 ， 而 在 双核 笔记 本 上 你 会 得 到 两 个 线程 。 
用 Ant 做 并 行 测试 


由 于 Apache Ant 和 默认 不 会 做 任何 事情 (不 像 Maven) ， 你 需要 显 式 地 调用 某 个 Ant 任 务 以 执行 你 的 测试 。 代 码 靖 单 9.6 展 示 
了 一 个 相当 典型 的 Ant 目 标 ， 用 来 以 串 行 的 方式 来 运行 项 目 中 的 JUnit 测 试 。 


代码 清单 9.6 ”用 来 运行 Junit 测 试 的 典型 Ant 目 标 


<target name="test"> 
“mR OTP TN- 
<Junit errorproperty="failed" failureproperty="failed'" 
haltonfailure="false" haltonerror="false" 
fork="yes" forkmode="perBatch"> 
<formatter type="xml"/> 
<classpath refid="test.classpath"/> 
<batchtest todir="build/junit-output"> 
<fileset dir="src/test/java"> 
<include name="**/Test*.jJava"/> 
<include name="**/*Test.jJava"/> 
</fileset> 
</batchtest> 
< FUnNnTt> 
</target> 


代码 清单 9.6 中 的 目标 克隆 (fork) 了 一 个 干净 的 久 VM 实例 用 于 批量 运行 所 有 的 单元 测试 。 克 隆 一 个 VM 来 运行 测试 是 一 个 


好 的 实践 ， 但 是 要 确保 你 没有 克隆 过 多 的 JVM 实 例 。 你 大 概要 把 forkmode 设 置 为 once 或 perBatch; 而 默认 值 perTest 在 运行 每 
个 测试 时 都 会 打开 一 个 新 的 JVM。 


遗憾 的 是 ，Ant 不 像 Maven， 没 有 内 置 并 行 运行 测试 的 方式 。 你 需要 目 己 动 手 一 只 是 一 些 跑腿 的 事 儿 。 代 码 清单 9.7 展 示 
了 一 个 配置 ， 它 将 测试 套件 分 解 为 四 批 ， 并 为 每 批 创建 一 个 JVM 实 例 ， 从 而 有 效 地 并 行 运行 测试 。 





代码 清单 9.7 用 于 并 行 运 行 Junit 测 试 的 Ant 脚 本 


<taskdef resource="net/sf/antcontrib/antcontrib.properties"> 
<classpath refid="compile.classpath"/> 
</taskdef> 


<property name="filter" 


value="com.lassekoskela.ant.selectors.RoundRobinSelector"/> 


<target name="test"> 运行 并 行 
“nk dirTe"BUuUlLgd/ TE -0uGEt "YS 任务 
<parallel threadcount="4"> 

<antcallback target="-run-test-batch" return="failed"> 


<param name="jJunit.batches" value="4"/> 
oaram name=" nit baton"™ vealues" 1s 
/antoaLlloack> 


<antcallback target="-run-test-batch" return="failed"> 


我 们 来 看 看 代码 清单 9.7 都 做 了 什么 。 当 调用 test 目 标 时 ， 我 们 为 测试 结果 文件 创建 了 一 个 输出 目录 ， 并 设置 了 并 发 块 @ 用 
于 在 四 个 线程 中 执行 任务 。 每 个 任务 @ 调 用 一 个 参数 化 目标 合 来 运行 测试 套件 的 一 部 分 。 一 旦 所 有 的 并 行 任务 都 完成 了 ， 我 们 就 
检查 是 否 存 在 失败 标志 ， 如 果 有 的 话 就 使 构建 全 失败 。 


代码 清单 9.7 中 令 你 吃惊 的 就 是 <custom/> 元 素 ， 它 是 我 们 对 Ant 的 类 型 层次 所 做 的 自 定义 扩展 。 中 I 代码 清单 9.8 中 展示 了 有 


趣 的 RoundRobinSelector。 (完整 的 代码 参见 https://github.com/lkoskela/ant-build-utils。) 我 们 省 略 了 用 于 连接 


<param/> 元 素 与 private 字 段 的 琐 磅 细节 。 
代码 清单 9.8” 自 定义 的 Ant 类 型 会 以 round-robin 风 格 来 过 滤 某 些 测试 


public class RoundRobinSelector extends BaseExtendSelector { 
private int counter; 
private int partitions,; 
private int selected; 


public boolean isSelected(File dir, String name, File path) { 


© 


Counter = (counter % partitions) + 1; 
return counter == selected; 


RoundRobinSelector 会 根据 所 在 分 片 从 整个 测试 套件 中 选择 第 n 个 测试 类 。 它 不 会 将 测试 最 优 地 分 配 到 四 个 线程 中 ， 但 却 
是 一 个 相当 好 的 分 配方 式 。 


你 看 到 了 两 个 用 于 运行 JUnit 测 试 的 Ant 脚 本 ， 其 中 一 个 是 并 行 的 万 式 。 这 两 个 配置 的 相对 性 能 如 何 ” 用 四 个 并 行 批量 的 方 
式 蔡 代 一 个 大 批量 的 万 式 来 运行 测试 ， 究 葛 快 多 少 ? 具体 的 影响 会 因 代码 的 不 同 而 不 同 ， 但 在 我 的 一 个 项 目 上 显示 了 20% 的 巨大 
改进 ， 很 大 程度 上 是 因为 那里 的 测试 包含 了 很 多 涉及 文件 和 网 络 VO 的 集成 测试 。 

如 你 所 见 ， 并 行 构建 从 而 利用 多 核 和 多 绪 程 来 并 友 地 运行 测试 ， 这 点 相对 容易 做 到 。 对 于 典型 的 单元 测试 套件 来 
襄 ，“ 仅 ”能 减少 5% 的 忌 体 构建 时 间 。 无 论 如 何 ， 所 有 这 些小 的 改进 会 积 少 成 多 ,没有 理由 不 去 找到 最 优 的 线程 数量 来 运行 你 
的 测试 。 


况 到 这 ， 如 果 你 想 要 更 大 的 提升 ， 那 么 ， 比 起 使 用 更 快 的 CPU， 另 外 一 些 做 法 会 给 你 更 大 的 力量 。 


9.3.3 ”改换 为 局 性 能 CPU 


典型 的 构建 会 将 大 部 分 时 间 消 耗 在 CPU 的 等 待 上 面 。 换 名 话说， 最 大 的 一 个 瓶颈 很 可 能 是 CPU， 而 加 速 CPU 也 能 立即 加 速 
你 的 构建 。 想 象 一 下 ， 现 在 你 无 法 给 计算 机 真正 地 更 换 CPU， 那 么 你 如 何 能 得 到 更 快 的 CPU? 


几 年 前 我 工作 在 一 个 项 目 中 ， 积 累 了 一 个 很 大 的 构建 。 运 行 一 次 完整 又 干净 的 构建 意味 着 要 编译 数 干 个 类 ， 并 在 几 个 模块 上 
运行 2 万 个 上 自动 化 测试 。 在 我 的 笔记 本 上 完整 构建 要 花 24 分 钟 ， 这 意味 着 开 友 人 员 在 向 版 本 控制 提交 代码 之 前 不 会 运行 完整 测 
试 。 反 过 来 ， 这 导致 构建 几乎 长 期 琢 坏 ; 总 有 一 些 代码 没有 编译 或 某 个 测试 被 打 丰 了。 然而， 那 不 仅仅 是 反馈 缓慢 。 当 构建 运行 
时 ， 那 台 计 算 机 实际 上 没 法 再 使 用 了 ， 因 为 构建 消耗 了 所 有 的 CPU 核心 。 


情况 令 人 无 法 忍受 ， 几 个 开 友 人 员 冯 试 调整 构建 系统 ， 和 希望 能 够 加 快速 度 一 没 效 果 一 直到 某 天 ， 一 个 同事 工作 时 市 来 
了 一 个 开 箱 即 用 的 解决 方案 。 他 精简 了 构建 脚本 ， 并 将 所 有 繁重 工作 都 转移 到 远程 计算 机 上 。 图 9.7 展 示 了 此 项 设置 。 
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图 9.7 基于 云 计 算 平台 的 远程 构建 设置 


你 要 做 的 束 是 向 虚拟 聊天 室 里 的 名 为 Joe 的 机 器 人 友 送 一 条 消息 ， 要 求 一 台 服 务 器 ， 然 后 把 你 得 到 的 主机 名 导出 到 环境 变量 
中 。 下 次 它 丈 会 神奇 地 在 远程 计算 机 上 运行 构建 ， 不 会 再 吃 挥 我 们 上 自己 的 CPU 了 。 


机 器 人 会 调用 Amazon Web Services (AWS,， 0 来 为 开发 人 员 分 配 一 台 虚 拟 服 务 器 。 
当 构 建 脚本 侦 测 到 用 于 运行 构建 的 虚拟 服务 器 已 经 分 配 时 ， 它 会 将 开 友 人 员 的 代码 的 工作 拷贝 用 rsync 同 步 到 服务 器 上 ， 用 ssh 通 
过 管道 (pipe) 在 服务 器 上 执行 构建 命令 。 代 人 码 清单 9.9 展 示 了 一 个 稍微 简化 的 用 于 Maven 工 程 的 构建 脚本 。 


代码 清单 9.9 ”用 于 在 远程 服务 器 上 运行 Maven 构 建 的 UNIX shell 脚 本 


#1 /bin/bash 


function usage { 
Echo "usage: $0 [options] [arguments for maven]" 


ECNo "" 

echo "Optlions:" 

Echo " -h/--help Display this help.”" 

Echo " -1/--local Euild locally." 

ECNo " -rr/--remote [|nostnamel Build remotely on gliven server." 
echo "" 


echo "Note: Unless overridden with -1 or -r, the remote" 
Echo "build machine's hostname is determined from the" 
echo "REMOTE MACHINE environment wariable (if present).”" 
echo "" 


} 


BULLD CMD="mvn" 


代码 清单 9.9 中 的 脚本 先 解 析 给 出 的 参数 @， 然 后 决定 在 本 地 还 是 远程 @ 进 行 构建 而且， 如果 是 远程 的 话 ， 还 要 知道 是 哪 
个 服务 器 ) 。 如 果 要 远程 构建 ， 脚 本 会 先 拷贝 本 地 文件 到 服务 器 上 合 ， 然 后 在 服务 器 上 合 调 用 Maven， 最 后 将 构建 结果 合 下 载 
到 开发 人 员 的 本 地 文件 系统 中 。 在 每 天 的 首次 构建 中 ， 通 过 网 络 上 传 和 下 载 的 开销 不 超过 一 分 钟 ， 而 当天 随后 的 构建 都 只 有 几 秒 
而 已 。 


整体 构建 的 效果 如 何 ? 多亏 了 Amazon 提 供 的 最 强大 的 计算 单元 oj， 可 以 用 来 在 并 行 线程 中 运行 构建 ， 曾 经 是 24 分 钟 ， 现 
在 却 少 于 4 分 钟 。 成 本 增加 了 吗 ? 每 个 开发 人 员 每 天 大 约 5 美元 。 它 将 你 的 构建 时 间 从 24 分 钟 减少 到 4 分 钟 以 下 ， 算 起 来 是 个 不 错 


的 交易 。 


这 个 故事 的 美妙 乙 处 在 于 ， 尽 管 我们 没有 升级 目 己 的 笔记 本 来 得 到 更 快 的 CPU， 我 们 也 可 以 从 类 似 Amazon 的 云 计算 提供 商 
来 获得 虚拟 服务 器 。 我 们 的 方案 基本 上 是 一 堆 自己 编写 的 shell 脚 本 ， 用 于 服务 器 分 配 、 工 作 区 同步 和 远程 命令 。 尽 管 这 是 可 行 
的 ， 但 你 还 有 一 个 更 容易 的 方法 。 更 容易 的 办 法 融 是 使 用 不 止 一 台 远 程 计算 机 。 我 们 为 什么 不 去 瞧 瞧 ， 看 看 它 是 不 是 像 看 上 去 那 
么 美好 呢 ? 


9.3.4 分布 式 构 建 


如 果 对 大 多 数 构 建 来 说 ， 最 大 的 杠杆 是 使 用 更 快 的 CPU， 那 么 用 17 个 更 快 的 CPU 如 何 ? 对 大 多 数 项 目 来 说 这 是 可 能 的 ,但 
使 用 多 从 计算 机 〈 及 其 所 有 的 CPU 核心 ) 来 承担 重任 融 确 实 值得 认真 考虑 了 。 我 们 先 通过 分 解 问题 来 理 理 思 路 : 要 在 多 台 计 算 
机 上 远程 运行 你 的 构建 ， 你 需要 弄 清 什么 ? 


乍 先 ， 远 程 运行 构建 需要 你 复制 必要 的 代码 、 数 据 和 其 他 资源 到 远程 计算 机 上 ， 作 为 你 个 人 的 运算 中 心 。 其 次 ， 你 需要 找到 
某 种 方式 来 触 友 要 在 计算 机 上 执行 的 命令 ， 用 来 将 日 志和 输出 文件 下 载 到 开 友 人 员 的 计算 机 上 。 代 码 清单 9.7 所 展示 的 项 目 中 ， 
我 们 用 一 些 Ruby 和 shell 脚 本 做 到 了 这 几 点 。 

要 用 多 台 计 算 机 来 做 分 布 式 构 建 ， 这 些 还 不 够 。 你 还 需要 找到 某 种 方式 来 进行 并 行 化 构建 。 为 了 并 行 化 ， 你 需要 决定 如 何 切 
分 工作 ， 这 样 你 残 可 以 向 一 群 随机 的 、 互 不 了 解 的 计算 机 单独 地 分 友 睛 段 。 


将 构建 切 分 成 可 分 友 的 卢 段 


图 9.8 可 以 帮助 我 们 理解 问题 的 上 下 文 。 图 中 摘 绘 了 在 构建 过 程 中 的 必要 步 又。 一切 都 从 一 组 源 文 件 代码、 图片 、 数 据 文 
件 等 ) 开始 ， 它 们 都 被 编译 成 字 古 码 。 利 用 编译 后 的 代码 ， 你 束 可 以 运行 测试 ， 生 成 一 组 测试 结果 文档 。 最 后 ， 那 些 测 试 结果 文 
档 可 以 整理 成 一 个 天 于 整个 构建 的 报告 。 


"Test 





图 9.8 ”构建 将 源 代 码 编 译 成 字 节 码 ， 运 行 测试 来 生成 测试 结果 ， 然 后 将 测试 结果 收集 到 报告 中 


那么 你 如 何 将 此 工作 流 切 分 成 平行 的 片段 呢 ? 你 应 该 已 经 看 到 并 行 化 本 地 构建 的 方式 。 假 设 你 已 经 具备 了 必要 的 shell 脚 
本 ， 用 于 将 整个 构建 推送 到 远程 服务 器 来 执行 ， 那 么 ， 用 代码 清单 9.7 中 的 Ant 脚 本 推送 测试 套件 的 每 个 分 片 到 远程 计算 机 也 不 
是 很 大 的 一 步 。 


同样 ， 由 于 Ant 和 Maven 的 标准 测试 运行 器 生成 的 测试 结果 文件 是 唯一 命名 的 ， 那 么 将 构建 生成 的 所 有 输出 下 载 到 开 友 人 员 
计算 机 上 的 一 个 单独 文件 夹 中 ， 这 是 微不足道 的 ， 它 们 用 于 最 终生 成 测试 报告 。 


更 具 挑 战 的 是 编译 步骤 。 对 编译 进行 切 分 是 困难 的 ， 因 为 你 无 法 随机 地 在 一 台 计 算 机 上 编译 50% 的 源 代码 ， 而 在 另 一 人 台 上 编 
译 剩 下 的 50%。 代 码 是 有 依赖 的 ， 意 味 着 你 的 切 分 算法 要 更 为 复杂 。 在 实践 中 ， 你 需要 分 析 依 赖 和 理解 代码 的 结构 ， 这 样 你 束 能 


先 编译 公共 接口 ， 然 后 针对 公共 接口 的 字 节 码 来 平行 地 编译 其 余 的 模块 。{1 


押运 的 是 ， 对 于 大 多 数 Java 工 程 来 咒 ， 构 建 步 又 比 测试 执行 要 快 得 多 ， 所 以 你 基本 上 可 以 在 一 台 计 算 机 上 一 次 性 编译 ， 然 后 
将 注意 力 放 在 并 行 化 与 分 布 式 地 执行 测试 上 。 


用 GridGain 来 分 布 式 地 执行 测试 


关于 分 布 式 计算 的 好 消息 就 是 没有 消息 一 一 软件 开发 工业 已 经 化 了 几 十 年 来 研究 让 计算 机 互相 通话 的 方法 。 对 于 Java 程 序 
员 来 况 ， 涉 及 JVM 的 进步 尤其 有 趣 ， 任 何 能 用 尽 可 能 少 的 代码 来 进行 分 布 式 计算 的 扩 林 都 会 引起 我 们 的 注意 。 


符合 描述 的 一 个 技术 就 是 GridGain 上 。GridGain 是 一 个 开源 中 间 件 产品 ， (与 其 他 产品 一 起 ) 允许 你 将 工作 负载 分 发 到 网 
格 (grid) 中 : 网 络 中 任意 数量 的 计算 机 。 换 句 话 说， 你 可 以 在 自己 办 公 室 的 本 地 环境 中 建立 AWS 风 格 的 云 计算 中 心 。 


关于 GridGain 有 个 好 消息 ， 还 有 个 坏 消息 。 好 消息 是 GridGain 针 对 分 布 式 JUnit 测 试 提供 了 工具 。 坏 消息 是 你 需要 严格 遵循 
步骤 来 建立 测试 套件 。 


为 了 理解 那些 约束 ， 我 们 看 看 代码 清单 9.10 展 示 的 一 个 测试 套件 的 例子 ， 其 中 的 注解 表示 用 GridGain 的 GridJunit49Suite 运 
行 器 来 运行 。 


代码 清单 9.10 ”GridGain 现 在 支持 的 测试 套件 划分 成 了 固定 的 三 个 分 片 


lmPort org.gridgain.grid.test.Junit4.GridJunit4Suite; 
| | 使 用 GridGain 
&@RunWith (GridJunit4Suite.class) < 业 必 本 上 是 乱 


@SuiteClasses(t{ 


FixedDistributedTestSuite. Partitionl .class, < 
FixedDistributedTestSuite.Partition2.class, 在 分 布 式 套件 中 
FixedDistributedTestSuite.Partition3.class 村 人 举 每 个 分 片 


a 


Public class FixedDistributedTestSuite { 


a&RuUunNnWith (Suite.class) 

&SuiteClasses(t < 
com.manning.PresentationEventTest .class, 
com.manning.PresentationSessionTest.class, 
Com.manning.PresentationListTest.class, 
com.manning.PresentationTest.class 


}) 

Dublic static class Partitionl { } 

&@RUNnWith (Suite.class) 概 举 属于 每 个 
ESuiteClasses(t < 小片 的 测试 类 


Com.manning.DownloadTest .class, 
com.manning.DownloadItemTest .class, 
CoOm.manning.ProductEgqualsTest.class, 
com.manning.ProductTest.class 

2) 


Dublic static class Partition2 { } 


@RuUunNnWith(Suite.class) 
QSuiteClassest{t 





Com.manning.HttpDownloaderTest .CaSS ， 
Com.manning.SocketListenerTest.class, 
com.manning.TcpServerTest.class 

了 


DUublic static class Partition3 { } 


代码 清单 9.10 中 的 测试 类 是 个 相当 标准 的 JUnit 测 试 套件 类 。 令 其 有 点 不 寻常 的 是 @RunWith 人 @ 注 解 ， 它 告诉 JUnit 把 自己 交 
给 GridGain 的 分 布 式 运行 器 。 另 一 个 不 寻常 的 地 方 是 套件 包含 了 三 个 测试 类 ， 它 们 作为 顶层 套件 @ 的 内 部 类 来 为 开发 人 员 提 供 
便利 。 


内 部 类 将 测试 类 划分 为 固定 的 三 个 分 片 (partitions) 合 。 因 为 我 们 (目前 ) 还 不 能 在 运行 期 对 此 进行 编程 ， 我 们 只 得 手动 
将 测试 分 解 ， 然 后 明确 地 一 个 接 一 个 地 调用 。 这 当然 不 是 我 们 喜欢 的 方式 ， 但 是 现在 ， 这 是 我 们 在 GridGain 的 限制 下 可 以 做 到 
的 最 好 方式 。 

在 撰写 本 文 时 ，GridGain 仅 支持 标准 的 套件 运行 器 ， 这 意味 着 你 不 能 使 用 诸如 JUnit-DynamicSuite 等 工具 ， 以 编程 的 方式 
收集 要 执行 的 测试 类 。 中 | 


运行 代码 清单 9.10 中 的 FixedDistributedTestSuite 并 没有 什么 稀奇 的 。 它 只 是 在 你 目 己 的 计算 机 上 本 地 运行 所 有 的 测试 。 为 
了 分 布 式 执行 测试 ， 你 还 缺 的 是 建立 网 格 证 点 ， 并 连接 到 一 些 工作 证 点 ， 令 其 承担 你 的 重任 。 


GridGain 附 审 了 示例 配置 和 局 动 脚 本 ， 用 于 开局 分 布 式 执行 测试 的 节点 。 代 码 清单 9.11 展 示 了 运行 局 动 脚本 的 输出 ， 即 
bin/ggjunit.sh。 


代码 清单 9.11 用 shell 脚 本 启动 GridGain 节 点 


Lnrod unit.sn 
GridGain Command Line Loader, ver. 3.6.0c.09012012 
2012 Copyright (C) GridGain Systems 


[01:46708] i 

[OL06308] 7 /ij 

[OOd se63s08I 7 LE A LI LI 
”AL 

[O146*081 

I0lLs*46:08| -—— 二 =++ REAL TIME BIG DATA ++==--- 

[01:46:081] Wer. :3 0 00=509012012 

[01:46:08] 2012 Copyright (C) GridGain Systems 

[01:46:08 】j 

[01:46:08] Quiet mode. 

[01:46:08] << Community Edition >> 

[01:46:08] Daemon mode: off 

[01:46:08] Language runtime: Java Platform API Specification ver. 1.6 
[01:46:08] GRIDGAIN HOME=/usr/local/gridgain 

[01:46:09] Node JOINED [nodeId8=c686a6b7, addr=[192.168.0.24], CPUs=2] 
[01:46:11] Topology snapshot [nodes=4, CPUs=2, hash=0xDE6BBF3C]| 
[01:46:11] Topology snapshot [nodes=2, CPUs=2, hash=0x840EB9D0] 
[OLs46*11] Node JOINED [Inoderde8=fezZ26de5. addr=s[1i9g2.160698 .0,260]y CPUS=2) 
[二 

[01:46:11] Local ports used [TCP:47102 UDP:47200 TCP:47302 | 
[01:46:11] GridGain started OK 

Ee bd Vs rid="nt gp CPUS=2 addre= [39326802 
Ls 人 和 玉 和 


在 一 些 网 络 服 务 器 上 运行 bin/ggjunit.sh 局 动 脚本 ， 从 而 建立 一 些 工作 节 上 后， 现在 你 可 以 运行 代码 清单 9.10 中 的 测试 套件 
了 ， 然 后 看 着 你 的 测试 在 多 个 网 格 节 点 上 并 行 地 执行 : 

[O146:519] Node, JOINED [riodeTd8=f6c226d65, addr=[192 .168.0.24],; CPUSB=2] 

[01:46:19] Topology snapshot [nodes=4, CPUs=2, hash=O0xAFOC4685] 

Distributed test started: equality (ProductTest) 

Distributed test finished: equality (ProductTest) 

Distributed test started: addingPresentations (ProductTest,) 

Distributed test finished: addingPresentations (ProductTest) 


Distributed test started: removingPpresentations (ProductTest) 
Distributed test finished: removingPresentations (ProductTest) 


天 于 对 JUnit 运 行 器 的 支持 ， 你 已 经 了 解 了 GridGain 目 前 的 限制 。 遗 憾 的 是 ， 这 很 可 能 不 是 你 会 遇 到 的 唯一 限制 。GridGain 
将 要 面 对 的 挑战 很 多 ， 比 如 运行 那些 从 class path 碍 找 资 源 的 测试 ， 更 不 用 说 查找 文件 系统 中 的 文件 。 天 于 分 布 式 地 在 多 个 计算 
机 上 运行 纯粹 的 单元 测试 ，GridGain 已 经 相当 优秀 了 。 


忌 之 ，GridGain 系 统 是 分 布 式 测试 执行 的 前 沿 设 施 。 它 有 其 局 限 性 ， 会 令 你 不 舒服 。 但 这 并 不 是 说 如 果 GridGain 不 完全 满 
足 要 求 ， 你 就 放弃 所 有 的 希望 。 你 总 是 可 以 采用 优秀 而 古老 的 shell 脚 本 来 建立 自己 的 分 布 式 构建 中 心 。 毕 竟 ， 如 果 你 寻求 加 速 
目 己 的 构建 ， 类 似 用 多 从 高 性 能 计算 机 来 代 蔡 单 台 计算 机 那样 ， 忆 是 会 有 很 多 同样 具有 潜力 的 方法 ! 


[1] 如 果 你 运行 在 UNIX 家 族 的 系统 上 ， 你 需要 运行 bgs、top、mpstat、saf、iostat、vmstat、flemon 和 tprof 等 工具 来 了 解构 建 的 特 
征 。 

[2] 见 KRAM drive》 , http://en.wikipedia.org/wiki/RAM. disk。 

[3] 风 tempfs, http://en.wikipedia.org/wiki/ Tmpfs。 

[和 如果 你 对 魔法 数字 256 000 好 奇 ， 其 实 hdid 的 大 小 是 按照 512 字 节 块 来 计算 的 : 256 000 X512bytes=128MB。 

[5] Custom Components， 参 见 http://ant.apache.org/manual/Types/custom-programming.html。 

[6] 如 果 我 记得 没 错 ， 那 是 8 核 CPU。 

[1 无论 你 是 否 要 并 行 化 构建 ， 模 块 化 的 代码 都 会 是 一 个 好 主意 。 

[8] 到 https://github.com/gridgain/gridgain 上 更 多 地 了 解 GridGain。 

[9] 参见 https://github.com/cschoell/Junit-DynamicSuite， 更 多 地 了 解 JUnit-DynamicSuite， 以 及 如 何 从 文件 夹 来 创建 动态 的 JUnit 测试 
套件 。 


9.4 小 结 


本 章 全 是 天 于 加 速 测试 执行 和 尽快 获得 构建 失败 的 反馈 。 


我 们 先 查 看 了 如 何 快速 地 查 明 缓慢 的 因素 一 一 潜在 可 以 大 量 提速 的 热点 。 这 里 的 天 键 字 是 性 能 分 析 (profiling) ， 我 们 看 
到 了 一 些 工 具 ， 可 以 用 来 探寻 你 的 构建 中 到 扶 哪 些 地 亡 消 耗 了 最 多 时 间 。 





接 下 来 我 们 检查 你 的 测试 代码 ， 看 是 否 有 什么 可 以 优化 的 ， 我 们 依次 细 癌 了 最 单 见 的 缓慢 乙 源 : 超过 实际 需要 的 线程 睡眠 时 
间 、 脱 胀 的 继承 层次 市 来 不 必要 的 代码 执行 、 测 试 缺乏 足够 的 隔离 、 与 网 络 交 互 的 测试 ， 以 及 读 写 文件 系统 的 测试 。 


我 们 也 识别 出 一 些 方 法 ， 通 过 改变 构建 方式 来 加 速 构建 。 比 如 ， 将 转动 式 硬 盘 改 成 固态 硬盘 或 者 RAM 磁 盘 ， 可 以 提升 你 的 
|/O 性 能 。 至 于 测试 中 受 限 于 CPU 的 部 分 ， 你 可 以 并 行 化 测试 套件 ， 利 用 所 有 的 CPU 来 并 友 地 执行 测试 。 更 进一步 ， 你 可 以 将 测 
试 分 布 到 远程 计算 机 来 执行 。 


所 有 这 些 选 项 都 潜在 地 可 以 提升 你 的 构建 时 间 。 能 否 感受 到 加 速 也 取决 于 上 下 文 。 最 好 你 能 尝试 一 下 ， 看 看 效果 。 分 析 你 的 
构建 来 更 好 地 理解 叱 ， 然 后 依次 尝试 最 有 希望 的 办 法 ， 看 看 它们 能 市 来 多 大 的 变化 。 


本 章 也 终结 了 本 书 的 第 三 部 分 ， 也 就 是 最 后 一 部 分 。 第 一 部 分 介绍 了 目 动 化 单元 测试 的 收益 和 强大 之 处 ， 探 讨 了 使 单元 测试 





变 得 优秀 的 方方面面 ， 给 出 一 些 有 效 使 用 测试 蔡 身 的 指点 。 第 二 部 分 跳 入 测试 坏 味道 的 目录 一 一 应 当 刺 痛 你 的 感官 的 各 种 模 
式 ， 因 为 它们 通常 意味 着 重 构 的 必要 性 。 
第 三 部 分 带 给 你 一 个 真正 的 世界 环 游 。 我 们 先 讨论 什么 是 可 测 的 设计 。 然 后 放眼 全 球 来 探索 不 同 的 JVM 语 言 ， 尝 试用 Java 


之 外 的 语言 来 编写 测试 。 最 后 ， 我 们 进入 现实 的 深 处 : 当 你 意识 到 构建 比 你 想象 的 缓慢 时 ， 你 要 做 些 什 么 。 


现在 该 回去 工作 了 ， 开 始 改 善 你 编写 的 测试 。 令 那些 测试 更 好 、 更 快 。 令 它们 更 有 意义 。 令 它们 更 有 用 。 即 使 你 现在 更 加 了 
解 测试 以 及 如 何 使 乙 杰 得 优秀 ， 它 也 不 会 在 一 夜 乙 间 友 生 。 季 运 的 是 ， 即 使 是 为 了 更 好 而 做 出 的 最 小 改变 ， 也 会 对 你 的 工作 幸福 
感 有 很 大 的 影响 。 


饮 你 好 运 ! 


附录 A_ JUnit 入 门 


在 Java 生 人 态 系 统 中 ， 现 如 今 事 实 上 的 单元 测试 框架 是 JUnit。 年 复 一 年 ， 越 来 越 少 的 Java 程 序 员 没有 见 过 JUnit 测 试 代码 了 。 
不 过 ， 每 个 人 总 有 第 一 次 ， 某 些 人 也 可 能 使 用 着 其 他 的 测试 框 娘 ， 那 么 我 们 编写 了 这 个 精简 的 附录 ， 帮 助 你 快速 地 开始 用 JUnit 
编写 测试 。 


理解 JUnit 有 两 个 基本 元 素 。 首 先 ， 你 必须 了 解 JUnit 测 试 代 码 的 结构 和 生命 周期 。 我 们 从 这 里 开始 。 我 们 将 看 一 看 如 何在 测 
试 类 中 定义 测试 方法 ， 然 后 熟悉 测试 的 生命 周期 一 一 JUnit 如 何以 及 何 时 实例 化 和 调用 你 的 测试 类 及 其 方法 。 


其 次 ， 融 是 JUnit 的 断言 (Assertion) API。 基 本 的 和 常用 的 断言 方法 很 简单 ， 你 看 到 它们 的 方法 签名 残 知 道 如 何 使 用 了 。 
因此 ， 我 们 只 会 通过 名 字 来 调用 这 些 方 法 ， 而 聚焦 于 那些 缺乏 目 我 解释 的 更 加 “不 透明 ”的 断言 。 


忌 的 来 说 ，JUnit 是 一 个 小 而 简单 的 框架 ， 我 定 不 怀疑 你 会 快速 地 学 会 运行 叱 。 最 终 你 会 在 某 些 地 方 卡 住 ， 可 以 求助 于 专门 
的 JUnit 书 籍 ， 比 如 Manning Publication 出 版 的 优秀 书籍 《JUnit in Action (2nd edition) 》 束 会 派 上 用 场 。 在 那 之 前 ， 我 希 
望 本 附录 包含 入 | 需要 的 全 部 内 容 ， 帮 助 你 跟 上 本 书 的 其 他 内 容 。 


A.1 基本 的 JUnit 测 试 类 


简 而 言 之 ，JUnNit 测 试 类 只 是 普通 的 Java 类 ， 包 含 一 个 或 多 个 测试 方法 ， 以 及 零 个 或 多 个 setup 和 teardown 方 法 。JUnit 也 为 
找到 的 测试 定义 了 一 个 简单 的 生命 周期 。 


以 下 章节 将 依次 讲解 JUnit 测 试 类 的 基本 元 素 ， 从 声明 测试 万 法 开始 。 


A.1.1 声明 测试 万 法 


JUnit 测 试 最 基本 的 形式 是 带 有 注解 的 普通 实例 方法 。 这 些 方法 执行 被 测 代 码 ， 使 用 JUnit 提 供 的 APl 来 断言 所 期 望 的 条 件 和 
副作用 。 代 码 清单 A.1 中 的 例子 是 一 个 简单 JUnit 测 试 类 的 样子 。 


代码 清单 A.1 带 有 @org.junit.Test 注 解 的 测试 方法 


I GFt BYU JUNLt TEE: 
limport static org.Junit.Assert.assertEquals; 


public class ExampleTest { 
@Test 
public void thisIsATestMethod() { 
assertEquals(5, 2 + 3); 
} 


QTest 

public void thisIsAnotherTestMethod() { 
WorldOrder newWorldOrder = new WorldOrder(),， 
assertFalse (newWorldOrder.1isComing () ) ; 


代码 清单 A.1 展 示 了 一 个 带 有 两 个 测试 方法 的 简单 JUnit 测 试 类 。 如 果 JUnit 发 现 一 个 非 public 的 方法 ， 就 会 忽略 它 。 如 果 发 
现 方法 市 有 参数 ， 束 会 忽略 它 。 如 果 方 法 返回 非 void， 惑 会 忽略 它 。 如 果 方 法 声明 为 static， 束 会 忽略 它 。 如 果 方 法 没有 JUnit 的 
@Test 注 解 ， 就 会 忽略 它 。 


真 的 很 简单 : 测试 方法 必须 是 public void 的 ， 并 且 不 带 参 数 。 


现在 看 看 JUnit 抓 到 测试 类 之 后 ， 测 试 所 要 经 历 的 生命 周期 。 


A.1.2 JUnit 测 斌 的 生命 周期 


以 代码 清单 A.1 中 的 类 为 例 ,JUnit 扫 摘 各 个 方法 ， 然 后 对 满足 上 述 约 束 的 签名 : 
- 实例 化 测试 类 的 一 个 实例 ; 

调用 测试 类 实例 的 setup 方 法 ; 

“ 调用 测试 类 ; 

- 调用 测试 类 实例 的 teardown 方 法 。 


对 测试 类 中 找到 的 所 有 测试 方法 ，JUnit 都 会 这 样 做 ， 包 括 继承 于 基 类 的 测试 万 法 。 同 样 ，setup 和 teardown 万 法 可 以 在 要 
运行 的 测试 类 中 定义 ， 也 可 以 在 基 类 中 定义 。 


如 果 测 试 没有 抛 出 异 单 ， 融 认为 它 通过 了 。 人 例如， 如果 没有 满 忠 条件， 代码 清单 A.1 中 的 assertEquals0 和 assertFalse() 上 断言 
就 会 抛 出 异常 来 使 测试 失败 。 同 样 ， 如 果 某 个 setup 或 teardown 方 法 抛 出 异常 ， 该 测试 就 会 被 认为 是 失败 了 ， 并 相应 地 报告 出 


A.1.3 ”测试 的 setup 和 teardown 


说 到 setup 和 teardown， 代 码 清单 A.2 中 的 小 例子 展示 了 它们 的 用 法 。 


代码 清单 A2 @Before 和 @After 注 解 标 示 了 setup 和 teardown 方 法 


public class ExampleTest { 
private Locale originalLocale,; 


@Before 

public void setLocaleForTests() { 1 为 测试 设置 
this.originalLocale = Locale.getDefault(); 已 知 的 区 域 
Locale.setDefault (Locale.US):; 设 定 

} 

@After 1 事后 恢复 原来 

public void restoreOriginalLocale() { 的 区 域 设 定 
Locale.setDefault (originalLocale); 

} 


代码 清单 A.2 中 给 出 一 个 测试 类 例子 ， 它 确保 了 在 测试 执行 期 间 活 动 区 域 设 定 是 Locale.US@， 并 确保 原来 的 区 域 设 定 在 事 
后 被 恢复 @。 我 们 是 童子 军 原则 [人 的 忠实 粉丝 ， 所 以 我 们 希望 在 测试 执行 之 后 ， 测 试 能 保持 原样 (或 者 更 好 ) 。 


测试 类 可 以 有 任意 多 的 @Before 和 @After 方 法 ; JUnit 会 确保 调用 每 一 个 ， 尽 管 它 不 保证 调用 的 顺序 。 


还 有 @BeforeClass 和 和 @AfterClass 注 解 ， 用 来 做 类 似 的 事情 ， 只 不 过 它们 对 每 个 测试 类 来 说 只 会 运行 一 次 ， 而 不 是 对 每 个 
测试 方法 运行 一 次 。 如 果 你 只 想 在 测试 类 的 所 有 测试 执行 之 前 或 之 后 运行 一 次 ， 那 就 用 得 到 这 些 。 3 
[1 测试 方法 可 以 声明 为 抛 出 异常 。 这 是 可 以 的 。 
D] 见 DO” Reilly commons 上 的 《The Boy Scout Rule》， 源 自 鲍 勃 大 叔 ，2009 年 11 月 24 日 ，http://mngbz/ Cn2Q。 


[3] 我 个 人 主要 将 其 用 在 集成 测试 的 上 下 文中 ， 确 保 在 发 起 网 络 连接 之 前 ， 茶 个 服务 器 组 件 正 在 运行 。 


A.2 ” JUnit 断言 
如 代码 清单 A.1 所 见 ，JUnit 提 供 了 一 组 常用 的 断言 ， 作 为 org.junit.Assert 类 中 的 public static 方 法 。 将 这 些 方 法 静态 地 导入 
是 一 个 常见 的 实践 ， 使 其 用 法 更 加 简洁 。 


新 言 用 于 检查 两 个 对 象 是 否 相等 ， 对 象 引 用 是 人 否 为 null， 两 个 对 象 引 用 是 人 否 指向 同一 个 对 象 ， 条 件 是 true 还 是 false， 等 等 。 
完整 的 断言 API 可 以 在 网 站 wwwjJjunit.org 找 到 ， 但 这 里 有 个 快速 的 概述 。 











* assettEquals 断言 两 个 对 象 (或 基本 对 象 ) 是 否 相 等 。 
* assertArrayE.quals 断言 两 个 数组 是 否 包 含 相同 的 元 素 。 
* assertTrue 断言 语句 为 真 。 
* assertFalse 断言 语句 为 假 。 














.assettNull 断言 对 象 引 用 为 空 。 
.assettNotNull 断言 对 象 引 用 不 为 空 。 
.assettSame 断言 两 个 对 象 引 用 指向 同一 个 实例 。 





* assettNotSame 


断言 两 个 对 象 引用 指向 不 同 实例 。 





assertThat 一 一 断言 对 象 满足 指 定 条 件 ( 见 A2.2 节 中 更 详细 的 解释 ) 。 


特殊 情况 需要 特殊 对 待 ， 因 此 咱们 快速 浏览 一 下 这 些 情况 。 首 先 ， 检 查 你 预期 抛 出 的 异常 。 
A.2.1 抛 出 断言 异常 


有 了 时 你 想 要 的 代码 行为 就 是 在 某 些 情况 下 抛 出 异常 。 例 如 ， 对 于 无 效 输入 ， 你 希望 抛 出 lllegalArgumentException。 如 果 
你 想 要 的 行为 束 是 异常 ， 而 JUUnit 将 测试 方法 抛 出 的 异常 理解 为 测试 失败 ， 那 你 要 如 何 测试 这 种 预期 的 异常 ? 


你 可 以 在 测试 方法 内 放置 try-catch 来 捕获 预期 的 异常 (而 且 ， 如 果 没 有 抛 出 异常 束 令 测试 失败 ) ， 但 JUni 提 供 了 更 方便 的 
万 式 来 做 这 件 事 ， 见 代码 清单 A.3。 


代码 清单 A.3 ”@Test 注 解 允 许 我 们 声明 预期 的 异 弟 


GTest (expected = IllegalArgumentException.class) 

public void ensureThatInvalidPhoneNumberYieldsProperException() { 
FaxMachine fax = new FaxMachine().,; 
fax.connect ("+n0t-a-phO0n3-Numb3r"); // should throw an exception 


代码 清单 A.3 中 我 们 使 用 了 Q@Test 注 解 的 expected 属 性 来 声明 我 们 期 望 在 测试 方法 执行 时 抛 出 一 个 
lllegalArgumentException。 如 果 没 有 抛 出 该 异常 (或 扫 出 了 其 他 的 异常 ) ， 测 试 融会 失败 。 


这 是 一 个 检查 异常 的 简洁 方式 。 但 有 时 你 想 更 具体 地 了 解 抛 出 的 是 哪 种 异常 。 例 如 ， 除 了 抛 出 的 异常 要 符合 某 个 类 型 之 外 ， 
你 还 想 检 查 其 “message” 中 携 市 的 特殊 信息 ， 或 者 它 封 装 了 某 种 “ 根 因 ”异常 。 


这 些 情况 下 ， 你 需要 回 深 到 古老 却 优秀 的 try-catch， 然 后 目 行 断言 。 代 码 清 单 A.4 展 示 了 之 前 例子 的 变 体 ， 它 额外 检查 了 抛 
已 
异 


出 的 异 弟 中 具体 提 到 的 无 效 参 数 。 


代码 清单 A.4 使 用 try-catch 来 检查 抛 出 的 异常 


GTest 
Publlc void ensureThatInvalidPhoneNumberYieldsProperException() { 
String invalidPhoneNumber = "+n0t-a-valld-ph0n3-Numb3r"; 
FaxMachine fax = new FaxMachine().,， 
try { 如 果 没 有 异常 
fax.connect (i1nvalidPhoneNumber); 人 捕获 期 望 
fail("should've raised an exception by now'" ) ; 此 喇 的 异 千 


} catch (IllegalArgumentException expected) { 


assertThat (expected.getMessage(), 讲 一 步 对 异常 
讲 行 断言 


containsString (invalidPhoneNumber) ) ; 


这 种 方法 将 Java 和 JUnit 的 全 部 威力 赋予 我 们 来 断言 任何 需要 检查 的 东西 。 然 而 这 有 点 喝 唆 ， 而 且 很 容易 志 记 调用 fail()， 所 
以 如 果 你 只 需要 检查 抛 出 异 单 的 类 型 ， 融 采用 基于 注解 的 方法 吧 ， 那 样 更 干将 和 简洁 。 


说 到 简洁 而 强大 的 断言 ， 当 org.junit.Assert 内 置 的 断言 不 能 满足 你 的 要 求 时 ， 你 总 是 可 以 用 自 定 义 匹 配器 来 扩展 强大 的 
assertThat()。 看 看 assertThat(0 和 Hamcrest 是 怎么 做 到 的 。 


A.2.2 assertThatO 和 Hamcrest 匹 配器 


org.junit.Assert 提 供 的 断言 中 要 数 assertThat(0) 最 为 特别 。 它 是 一 个 钩子 ， 人 允许 程 序 员 自行 扩展 基本 的 断言 ， 或 者 使 用 第 三 
方 匹 配器 库 。 


基本 语法 是 这 样 的 : 
assertThat (someObject, [matchesThisCondition]).; 
换 句 话 说， 第 一 个 参数 是 作为 断言 上 下 文 的 对 象 或 值 ， 而 第 二 个 参数 是 匹配 器 ，JUnit 会 将 实际 的 断言 工作 委托 给 它 。 


这 些 匹配 器 不 是 普通 的 对 象 ， 而 是 Hamcrest 匹 配器 。Hamcrest (https://github.com/hamcrest/JavaHamcrest) 是 一 个 
开源 API， 它 有 自己 的 一 组 标准 的 匹配 器 实现 ， 可 用 于 测试 。 


如 果 内 置 的 断言 或 Hamcrest 匹 配器 都 不 满足 你 所 要 表达 的 意图 ， 你 可 以 通过 实现 Hamcrest 的 Matcher 接 口 来 创建 自己 的 匹 
配器 。 假 设 你 要 断言 一 个 看 起 来 像 是 有 效 国 际 电话 号 码 的 字符 串 。 这 种 情况 下 ， 一 个 基本 的 自 定 义 Hamcrest 匹 配器 如 代码 清单 
A.5 所 示 。 


代码 清单 A.5 ”借助 assertThat(0 来 使 用 自 定 义 的 Hamcrest 匹 配器 


import statlic org.hamcrest.CoreMatchers.1s: 
Import static org.hamcrest.CoreMatchers.,not; 
1mport statlc org.Junit.Assert .assertThat. 


import org.hamcrest.BRBaseMatcher, 
import org.hamcrest.Description; 
mport org.hamcrest.Matcher: 
imeort org.junit.Test:; 


Dublic class ExampleTest 1 


rh 
好 忆 号 七 


DUbBl1ic Vold providesPhoneNumberInIinternationalFormat{() 1 


String phoneNumber widogetUnderTest .getPhoneNumber!(); 
assertThat (phoneNumber, is(linternationalPhoneNumber(}))}): 
b 
public Matcher<String> linternationalNumber(}) 1 ; 扩展 
return new BaseMatcher<String>() { el BaseMatcher 
并 二 此 
* ITU-T E.123 requires that international phone numbers 
* include a leading plus sign, and allows only spaces to 
* separate groups of digilits. 
村 下 
Override 
public boolean matches (Object candidate) { 9 只 接受 字 特 串 
1if (11f(CaTGQ1La 七 已 instanceof String)}) 1{ 
return talse:; 
return ((String) candidate) < 表达 各 来 匹配 
.matchest"^\ +t(?: [0-9] ?} {6,14} [0-9]s").; 
自己 二 有 包 档 广 我 们 的 
public void describeTo (Description desc) { i 期 望 
desc.appengdText ("ITU-T E.123 compliant " + 
" international phone number").:; 
1; 
} 


当 我 们 的 测试 调用 assertThat (phoneNumber, is (internationalPhoneNumber0) ) 时 ，JUnit 使 用 辅助 方法 创建 的 
BaseMatcher@ 来 执行 断言 。 


我 们 目 定 义 的 匹配 器 实现 包含 两 个 方法 。matches0 的 责任 是 指出 给 定 的 候选 对 象 是 否 通 过 了 断言。 本 例 中 ， 我 们 的 算法 微 
不 足 道 : 检查 对 象 确实 是 String@， 然 后 检查 它 满足 某 个 匹配 国际 电话 号 码 的 正则 表达 式 合 ， 


自 定义 匹配 器 中 第 二 个 方法 describeTo( 负 责 给 匹配 器 要 寻找 的 内 容 提供 有 意义 的 摘 述 。 如 果断 言 失败 ，JUnit 会 输出 类 似 
下 面 的 消息 : 
Java.lang.AssertionError: 


Expected: 1S ITU-T E.123 compliant international phone number 
got: "+1 (234) 567-8900" 


当 测 试 突然 失败 ， 这 融 很 有 用 ， 因 为 它 解 释 了 你 要 找 的 是 什么 ， 而 你 得 到 的 又 是 什么 。 好 吧 ， 这 种 情况 下 我 们 大 概 还 需要 得 
看 匹配 器 的 实现 ， 才 能 知道 兼容 ITU-T E.123 的 国际 电话 号 码 需求 一 除非 这 是 我 们 正在 工作 的 代码 库 。 


现在 我 们 已 经 介绍 了 JUnit 的 基本 元 素 。 了 解 这 些 之 后 ， 你 应 该 要 好 好 消化 一 段 时 间 了 。 当 你 最 终 碰 到 问题 而 需要 更 多 和 忒 西 
时 ， 请 参考 附录 B， 那 里 解释 了 如 何 进一步 扩展 JUnit， 不 仅仅 是 目 定 义 匹 配器 哦 。 


附录 B 扩展 JUnit 


4.0 版 本 之 前 的 JUnit， 其 AP| 是 基于 继承 自 junit.framework.TestCase 的 测试 类 ， 因 而 扩展 JUnit 要 履 盖 某 些 继承 行为 。 最 新 
版 的 JUnit 有 了 基于 注解 的 方式 ， 于 是 插件 出 现 了 新 的 形式 ， 是 与 一 一 你 猜 对 了 一 -一 注解 挂钩 的 。 





扩展 内 置 的 JUnit 行 为 的 主要 相关 概念 是 运行 器 (runner) 和 规则 (rule) 。 尽 管 我 们 不 大 会 深入 编写 目 定 义 插 件 ， 你 还 是 
应 该 意识 到 哪 种 插件 是 内 置 的 ， 以 及 如 何 开 始 编 写 目 定义 插件 。 


我 们 的 这 个 简要 介绍 移 从 运行 器 的 工作 方式 开始 。 实 现 目 定义 运行 器 不 是 件 小 事 ， 部 分 出 于 这 个 原因 ， 我 们 更 倾向 于 目 定 义 
规则 。 记 住 ， 本 附录 的 主要 内 容 集中 于 JUnit 的 规则 是 如 何 工 作 的 ， 以 及 哪些 规则 是 你 可 以 开 箱 即 用 的 。 


B.1 用 运行 器 来 控制 测试 9 执行 


我 们 说 过 ， 当 JUnit 没 有 在 你 的 测试 类 中 见 到 明确 的 @RunWith 注 解 ， 它 会 采用 默认 的 实现 。 但 这 些 运 行 器 是 什么 ， 它 们 又 
是 怎么 工作 的 ? 


当 有 人 告诉 JUnit 在 给 定 类 中 “运行 测试 ”，JUnit 会 从 后 兜 儿 中 掏 出 一 张 餐巾 纸 。 和 餐巾纸 上 写 有 一 系列 已 类 的 万 式 用 于 识别 
和 运行 指定 类 中 的 测试 。 那 些 方 式 表示 为 org.junit.runner.Runner 接 口 的 实现 。JUnit 一 个 接 一 个 地 人 遍历 列表 ， 直 到 找到 一 个 能 
够 处 理 手 头 的 类 的 运行 器 。 

例如 ， 人 列表 的 开头 是 一 个 构建 器 (builder) ， 它 可 以 处 理 市 有 @lgnore 注 解 的 类 。 往 下 看 ， 有 一 个 运行 器 可 以 处 理 明 确 市 
有 @RunWith 注 解 的 类 。 在 列表 最 后 是 默认 的 运行 器 ， 它 几乎 束 是 你 最 后 要 用 到 的 。 一 旦 JUnit 选 择 了 这 些 运行 器 中 的 一 个 ， 它 


会 将 实际 的 测试 运行 委托 给 该 运行 器 ， 如 图 B.1 所 示 。 





图 B.1 给 定 一 个 测试 类 ，JUnit 指 出 要 使 用 哪个 运行 器 。 如 果 存 在 @RunWith 注 解 ， 其 中 一 个 运行 器 会 响应 它 ， 然 后 将 测试 执行 委 


托 给 用 户 定 义 的 org.junit.runner.Runner 实 现 


从 扩展 JUnit 的 角度 ， 我 们 对 第 二 类 运行 器 最 感 兴 趣 ， 即 使 用 @RunWith 的 那个 。 有 了 @RunWith， 你 可 以 决定 JUnit 要 如 
何 对 待 你 的 测试 类 。 你 可 以 选择 使 用 内 置 运行 器 之 一 ， 比 如 Suite 或 Parameterized ( 稍 后 我 们 会 谈 到 这 个 “小 野兽 ″”) ， 或 者 
你 可 以 告诉 JUnit 使 用 你 自己 的 : 一 个 实现 抽象 Runner 类 的 类 。 


尽管 编写 目 定 义 的 运行 器 是 扩展 JUUnit 的 最 强大 方式 ， 但 是 它 也 超出 了 你 的 承受 能 力 。 盏 运 的 是 ，JUnit 的 多 数 插件 实际 上 不 
需要 一 个 全 新 的 运行 器 。 如 果 你 仅仅 需要 修改 单个 测试 的 处 理 方 式 ， 而 不 是 一 开始 融 决 定 识别 测试 的 方式 ， 那 么 或 许 你 应 该 移 考 
碟 使 用 或 实现 规则 ， 和 而 不 是 创建 一 个 目 定 义 的 运行 器 。 


B.2 ”用 规则 来 沪 饰 测试 \ 


规则 是 最 近 才 加 到 JUnit 中 的 。 它 能 操纵 测试 的 执行 。 比 如 ， 规 则 的 实现 能 跳 过 整个 执行 ， 或 在 测试 运行 前 后 来 执行 一 些 
setup 或 teardown。 规 则 是 应 用 到 类 这 一 级 ， 你 可 以 对 一 个 类 应 用 多 条 规则 。 多 条 规则 的 情况 下 ， 每 次 会 应 用 一 条 。 (JUnit 不 
保证 应 用 规则 的 顺序 。) 


JUnit 观 察 一 个 测试 类 时 ， 它 会 为 运行 每 个 找到 的 测试 而 建立 一 个 执行 计划 。 规 则 ， 即 org.junit.rules.MethodRule 的 实现 ， 
基本 上 会 封 六 或 替代 当前 的 执行 计划 。 为 了 湾 清 这 些 神秘 的 热心 肠 ， 咱 们 看 一 看 内 置 的 规则 。 


目 定 义 规 则 的 起 点 


当 你 决定 编写 自己 的 JUnit 表 达 式 时 ， 你 可 能 最 终 会 扩展 org.junit.rules.TestWatchman， 那 是 一 个 阅读 ]JUnit 源 代码 的 良好 起 点 。 


B.3 ”内 置 规 则 


JUnit 没 有 将 规则 API 作 为 一 个 扩展 点 提供 给 用 户 : 大 量 基础 的 JUnit 功 能 都 是 用 同样 的 API 实 现 的， 包括 整个 测试 类 的 全 局 起 
时 (timeout) 、 处 理 期 性 异 单 的 复杂 方式 ， 以 及 临时 文件 系统 资源 的 管理 。 我 们 移 看 看 如 何 为 一 个 类 中 的 所 有 测试 配置 全 局 超 


时 。 
B.3.1 ”配置 全 局 超时 
还 记得 我 们 说 过 用 @Test (timeout=X) 来 为 测试 方式 设置 超时 吗 ? 规则 API 让 你 可 以 一 次 性 地 为 类 中 的 所 有 测试 定义 超 
时 。 代 码 清单 B.1 的 例子 就 是 这 样 的 全 局 超时 。 
代码 清单 B.1 为 类 中 的 所 有 测试 方法 指定 全 局 超时 
import org.Junit.Test.; 


mort Org: JUunit. Rule; 币 有 @Rule 
import org.Junit.rules.Timeout,; 注解 的 规则 


public class GlobalTimeoutTest { 
GRuUle 
public MethodRule globalTimeout = new Timeout (20); 


规 刚 定义 尖 
@Test 出 Ee j 
Dudlie Yola ntnoteDneoclt -1 公有 字段 


while (true) { } 规则 定义 为 
} ye 
公有 字段 
QTest 


BUTe vod ntimiteLoopa{) 14 
while (true) { } 
} 


代码 清单 B.1 中 有 三 件 事 值 得 注意 : 
. 定义 一 个 MethodRule 类 型 的 公有 字段 @， 
. 字段 带 有 注解 @Rule@，。 
字段 的 名 字 对 JUnit 来 说 无 所 谓 ， 你 可 以 按照 自己 的 喜好 来 命名 。 名 字 基 本 上 是 描述 规则 的 目的 。 


在 代码 清单 B.1 中 ，JUnit 对 两 个 测试 方法 都 应 用 了 规则 ， 当 它们 超过 20 毫 秒 超时 配置 之 后 就 中 断 。 
B.3.2 ”预期 的 异常 


JUnit 的 @Test 注 解 接受 expected= 属 性 ， 用 于 在 没有 擅 出 指定 类 型 的 异常 时 使 测试 失败 。 还 有 一 个 稍微 复杂 的 方式 来 检查 
期 望 测试 的 属性 ， 比 如 异常 的 消息 、 根 因 等 。 (稍微 不 那么 复杂 的 方式 是 用 try-catch 来 捕获 异常 ， 然 后 马上 询问 异常 对 象 。) 
复杂 的 方式 是 ExpectedException 规 则 。 


代码 清单 B.2 中 的 例子 湾 清 了 使 用 方法 。 


代码 清单 B.2 ” ExpectedException 规 则 的 示例 用 法 


I GLO. UDLE TesE: 

import org.junit.Rule; 

lmport org.Jjunit.rules.ExpectedExcept1ion; 
public class ExpectedExceptionTest { 


@QRuUule 
public ExpectedException thrown = ExpectedException.none(); ExpectedExcep— 
和 tion 规则 初始 化 为 
@Test 6 » 
public void thisTestPasses() { } es 
@Test Ts 望 抛 出 
public void throwsExceptionAsExpected() { NullPointerException 
thrown.expect (NullPointerException.class); 
throw new NullPointerException().; 
} 
@Test 
public void throwsExceptionWithCorrectMessage() { 
thrown.expect (RuntimeException.class).; 人 期 望 异 第 中 包含 
thrown.expectMessage ("boom"); 下 “下 Con 
throw new NullPointerException("Ka-boom!"); 
} 


代码 清单 B.2 中 ， 我 们 有 一 个 ExpectedException 规 则 和 三 个 测试 。 在 其 初始 状态 ， 规 则 没有 期 望 抛 出 任何 异常 @。 这 就 是 
为 什么 即使 规则 应 用 到 了 所 有 测试 方法 上 ， 第 一 个 测试 还 是 会 通过 。 换 句 话说 ， 我 们 需要 配置 规则 ， 并 且 告 诉 它 我 们 期 待 的 是 哪 
类 异 单 。 这 惑 是 我 们 在 另外 两 个 测试 中 做 的 。 


在 第 二 个 测试 中 ， 我 们 告诉 规则 ， 期 望 抛 出 NullPointerException@。 “如 果 你 没有 见 到 这 种 异常 被 抛 出 ， 请 让 测试 失败 。 
”这 里 的 功能 基本 上 和 @Test (expected=NullPointerException.class) 提供 的 一 样 ， 所 以 也 没什么 好 激动 的 。 
ExpectedException 规 则 的 真正 价值 在 第 三 个 测试 中 才 显 现 出 来 。 


在 第 三 个 测试 中 ， 我 们 不 仪 告诉 规则 要 期 望 抛 出 某 种 类 型 的 测试 。 有 了 expectMessage (“boom”) ， 我们 也 告诉 它 去 
验证 包含 特定 子 串 的 异常 消息 一 一 在 我 们 的 例子 中 ， 是 单词 boom 合 (区 分 大 小 写 ) 。 注 意 此 时 我 们 告诉 ExpectedException 期 
望 一 个 RuntimeException ， 然 而 测试 实际 上 抛 出 了 一 个 NullPointerException ， 它 是 RuntimeException 的 子 类 。 这 个 测试 能 


够 通过 ， 是 因为 规则 所 执行 的 检查 只 关心 该 异 单 走 起 来 像 只 了 鸭子， 却 不 企 乎 它 不 是 只 真 鸭 子 。 
检查 根 因 


现在 你 知道 如 何 对 抛 出 的 异常 进行 测试 ， 看 它 是 否 是 预期 的 类 型 ， 以 及 消息 中 包谷 期 望 的 内 容 。 有 了 时 你 希望 抛 出 的 异常 中 封 
和 妆 了 特定 的 根 因 (cause) 。 代 码 清 单 B.3 中 的 例子 采用 了 目 定 义 的 逻辑 来 判定 抛 出 异 弟 中 是 否 符 合 我 们 的 预期 。 


代码 清单 B.3 ”测试 期 望 异 弟 中 的 任意 细节 


mport oryg.hamcrest. BaseMatcher:; 

Imoort org., hamerest, Description: 

jmport ordg.hamcrest.Matcher; 

LWmDOFEt OrFd. Unit.Rule; 

jmport org.Junit.Test:; 

mport org.Junit,.rules., ExXpectedExcept1on:; 


PUBlicG class ExcepntlonWlithExpectedRootcrauseTest { 


dRule 
PubBlic ExpectedExceptlion thrown = ExpectedException.nonel():; 糙 自 定 访 怠 
E E 目 定 名 的 
Test Hamcrest 
一 ] 7 rr 了] 门 于 rT 王 wm 人 [a 半 二 训 本 和 mn | 区 配 咒 异地 
PUD1IC vold throwsExceptlionWNIthCcorrectcCcausel) 二 + BL mr | 
thrown.expect (rootCauselOf (Nul llPolnterException.class})}) ;< ExpectedException 


throw new RuntimeExcentiontli"Boom!l", new Nul PointerExcenptiont}}.: 
1 


, 
| 


private Matcher<? extends Throwable> rootcCauseot' 创建 
Final Class<? Extends THNrowable exDeStedause) { BasceMatcher 
return new BaseMatchnert}) 1 的 子 类 
dOwverride 
public boolean matches (Object candidate) < 抽出 的 异常 
jf i!lcandidate instanceof Throwable)) 1{ 特 各 我 们 的 
return false; 预期 吗 ? 
} 
Throwable cause = (lIThrowable) candidate) .getCausel).; 
jf (cause == TU 1 


returr false: 
} 
return expectedCause.1s3MAsslgnableFromlcause .getcClasst)): 


} 


EOwverride 
EUbBlic oid i description) + 
escript ,DpendText ("Throwable with cause of tyBe " - 


descr jpt ion .ppendText lexpectedCause.c 径 七 号 1TTT pleNametl)).; 


i 


i 


代码 清单 B.3 中 出 现 了 两 个 从 未 见 过 的 JUnit 方 面 。 首 先 ， 我 们 使 用 了 不 一 样 的 ExpectedException#expect() 重 载 版 本 @. 
其 次 ， 通 过 使 用 这 个 重 载 方法 ， 我 们 使 用 了 名 为 Hamcrest 的 匹配 器 。 


Hamcrest (http://code.google.com/p/hamcrest) 是 一 个 开源 库 ， 它 提供 了 一 组 匹配 器 对 象 或 谓词 (predicate) 。 
JUnit 在 目 己 的 API 中 使 用 Hamcrest 的 接口 ， 代 码 清单 B.3 正 是 这 种 集成 的 一 个 例子 。 


接 下 来 看 看 ExpectedException#expect() 的 两 个 变 体 : 


void expect (Class<? extends Throwable> exceptionType) 
VOid expect (org.hamcrest.Matcher<?> matcher) 


用 第 一 个 方法 变 体 我 们 会 说: “请 检查 抛 出 的 异常 是 这 种 类 型 的 。” 用 第 二 个 方法 变 体 我 们 会 说 : “请 使 用 这 个 谓词 来 检查 
抛 出 的 异常 符合 我 们 的 期 望 。” 人 至 于 谓词 对 象 用 什么 逻辑 来 做 区 分 ， 那 是 程序 员 的 事情 一 一 你 束 是 程序 员 ，。 


在 这 个 例子 中 ， 我 们 创建 了 一 个 org.hamcrest.BaseMatcher@ 的 匿名 子 类 ， 它 决定 抛 出 异常 合 的 正确 性 。 我 们 需要 实现 两 


个 抽象 方法 : matches (Object) 和 describeTo (Description) 。 前 者 封 六 了 该 逻辑 ， 后 者 给 了 JUnit 一 种 方式 来 形成 有 意义 的 
错误 消息 ， 当 针对 期 望 异常 的 断言 失败 时 ， 谓 词 运算 就 为 false。 


BaseMatcher 


回想 一 下 BaseMatcher 和 代码 清单 B.3 中 自 定义 匹配 器 的 例子 。 你 要 编写 的 (如 果 你 需要 编写 ) 大 多 数 自 定义 匹配 器 都 会 从 那 
个 类 继承 而 来 ， 看 起 来 与 我 们 的 例子 会 非常 相像 。 


代码 清单 B.3 中 的 逻辑 规定 ， 我 们 首先 要 确保 给 定 的 候选 对 象 是 一 个 异常 。 然 后 ， 我 们 检查 它 带 有 一 个 根 因 ， 最 后 ， 我 们 检 
查 根 因 是 期 望 的 类 型 。 如 果 任 何 一 个 条 件 失败 ， 就 返回 false， 于 是 ExpectedException 规 则 会 使 正在 运行 的 测试 失败 。 


B.3.3 | 





介 时 文件 夹 


大 多 数 单元 测试 应 当 远 离 文件 系统 ， 但 时 不 时 地 会 要 编写 一 个 目 动 的 、 可 重复 的 、 与 文件 系统 中 的 文件 打交道 的 测试 。 这 是 
最 后 一 个 规则 的 用 武之 地 。TemporaryFolder 是 个 简单 的 工具 ， 利 用 它 你 可 以 容易 地 在 测试 中 创建 临时 文件 和 文件 来 ， 并 令 其 
在 测试 运行 之 后 目 动 地 消失 。 看 代码 清单 B.4 这 个 例子 。 


代码 清单 B.4 _ JUnit 内 置 一 个 用 于 临时 文件 夹 的 @Rule 


1Import JjJava.io.File; 

jmport org.jJunit.Rule; 

Nrt oro unlt,. Test: 

import org.jJunit.rules.TemporaryFolder.,; 


public class TemporaryFolderTest { 
QRUule 
public TemporaryFolder folder = new TemporaryFolder () ; 


GTest 
public void thisTempFileIsSquashedAfterTheTest() throws Exception { 
File tempFile = folder.newFile("myTempFile.txt"); 


assertTrue (tempFile.exists()); 创建 临时 
} 文件 
QTest 
public void allJunkWillBeGoneAfterTheTestHasRun() { 

File tempDir = folder.newFolder ("myTempDir").,， 

createRandomJunkIn (new File(tempDir, "mah-jJunk.txt")).; 创建 临时 

createRandomJunkIin (new File(tempDir, "moar-jJunk.txt")).; 文件 夹 


} 


private void createRandomJunkIin(File file) { 
// omitted for brevity 
} 


我 们 又 声明 了 一 个 规则 一 一 这 次 是 TemporaryFolder。 在 需要 临时 文件 的 测试 中 (第 一 个 测试 ) ， 我 们 要 求 规则 创建 一 个 
新 文件 @， 并 得 到 它 。 在 该 测试 之 后 ， 规 则 负责 将 文件 删除 。 在 第 二 个 测试 中 ， 我 们 创建 了 新 的 临时 文件 夹 @， 向 其 中 添加 了 几 
个 文件 ， 然 后 TemporaryFolder 再 次 将 其 清理 干净 。 整 洁 ! 





